perlunity.de - PERL | JAVASCRIPT | PHP | MySQL | APACHE



#!/COMMUNITY

Members: 5374
davon online: 1
weitere User: 27
Click for quality!




11.02.2012 / 19:46

Community-Member werden   |   Paßwort vergessen   |   OnlineMonitor (1) Wer ist online ... OnlineMonitor starten !
     

 

Home


PERLscripts


PHPscripts


JAVAscripts


Hilfreiches


Links2www


Newscenter


Community


Interna




Community  »  Perl: Allgemeines Forum zur Themenübersicht Themensuche Themenansicht in Thread-Modus


BeitragZeichenklassen
Seitenanfang
Hallo

Ich habe eine Frage zu Zeichenklassen:

Wie kann ich Umlaute und Unicode-Zeichen in Zeichenklassen bringen?
[\w] und [a-zA-Z] erkennt bei mir jedenfalls keine Umlaute und ß.
Was ich alles bisher erfolglos probiert habe:
-

 [a-zA-ZäöüÄÖÜß] 

- eine eigene Zeichenklasse definiert, wie im Kamel-Buch angegeben:

[\p{InDeutsch}]
und
sub InDeutsch {
return << 'END';
+utf8::IsASCII
+utf8::InLatin-1Supplement
END
}

- [$romaji]
wobei ich in der Variable $romaji folgendes Muster gespeichert habe:

$romaji = q{
[\x30-\x39]
| \xEF\xBC[\x90-\x99]
| [\x41-\x5A]
| [\x61-\x7A]
| \xEF\xBC[\xA1-\xBA]
| \xEF\xBD[\x81-\x9A]
| [\xC3-\xC5][\x80-\xBF]
};

(Diese Methode habe ich von Ken Lunde, und geht für andere Gelegenheiten, wie z.B.
@chars = $line =~ /$utf8/gox;
sehr gut) - hier hat es aber nicht gefruchtet.

Und wenn ich schon dabei bin: die Syntax für hexadezimale Unicode-Zeichen wie etwa \x{262f} hat bei mir noch NIE funktioniert (im Kamel-Buch stand, das sei das Zeichen für YIN und YANG, ist es auch, aber in UCS2 - dabei dachte ich, Perl sei so auf UTF8 fixiert). Obiges schreibe ich deshalb immer \x26\x2F - das geht. In einer Zeichenklasse ist das aber doof, weil ich ja sagen will "diese Ansammlung von Bytes ist EIN Zeichen!".

Wenn jemand eine Idee hat, oder Erfahrungen, sind die sehr willkommen. Vielen Dank im voraus.

felix

Datum: 08.08.2005-18:03

-






-
-