Некоторое время назад в файле perl5110delta появился странный раздел о том, что метасимволы \w и \d в регулярных выражениях должны совпадать только с ASCII-символами:
digit \d [0-9]
word \w [0-9A-Z_a-z]
К счастью, это пока не перекочевало в Perl 5.12, причем независимо от того, определен ли при компиляции символ PERL_LEGACY_UNICODE_CHARCLASS_MAPPINGS или нет.
Программа, от которой ожидается совпадение \w с русскими буквами, по-прежнему работает:
use v5.10;
use utf8;
use open qw(:utf8 :std);
"123abcабв" ~~ /(\w+)/;
say $1;
На печать выводится 123abcабв.
"\s \w and \d once again have the semantics they had in Perl 5.8.x." - perl5111delta.
I think it's wrong and we can't ignore Unicode (or make its usage difficult) in XXI century.