Ich hab hier noch ein logistisches Problem.
Und zwar überlege ich, wie ich die Character-Klassen organisiere.
Da diese klasse auf
Unicode und nicht nur auf
ASCII vergleicht, wären diese Klassen ebenso
Unicode.
z.B ist dieses
[A-Za-z0-9_]
nur
ASCII (da nur die
ASCII-Zeichen angegeben sind)
Nun gibt es aber logisch gesehen noch diese
\p{IsWord}
,
\w
und
[:word:]
.
Um es zu vereinfachen würde ich Eines/Einiges davon ebenso als
ASCII anlegen und den Rest als
Unicode.
Aktuell tendiere ich dazu
[:word:]
als
ASCII zu machen
und die Anderen würden dann alle Buchstaben und Zahlen aller Sprachen/Formatierungen enthalten.
Oder würde jemand etwas anderes empfehlen?
Ich versuche zwar die beste Kombination der PERL- und der POSIX-Syntax hinzubekommen, aber Änderungen, bzw. Erweiterungen wären schon möglich. (falls jemand eine Idee hat, wie man z.B. alles als
ASCII und
Unicode anlegt und dann einen "Umschalter" integriert)