Ich hab hier noch ein logistisches Problem.
Und zwar überlege ich, wie ich die Character-Klassen organisiere.
Da diese klasse auf
Unicode und nicht nur auf
ASCII vergleicht, wären diese Klassen ebenso
Unicode.
z.B ist dieses
[A-Za-z0-9_]
nur
ASCII (da nur die
ASCII-Zeichen angegeben sind)
Nun gibt es aber logisch gesehen noch diese
\p{IsWord}
,
\w
und
[:word:]
.
Um es zu vereinfachen würde ich Eines/Einiges davon ebenso als
ASCII anlegen und den Rest als
Unicode.
Aktuell tendiere ich dazu
[:word:]
als
ASCII zu machen
und die Anderen würden dann alle Buchstaben und Zahlen aller Sprachen/Formatierungen enthalten.
Oder würde jemand etwas anderes empfehlen?
Ich versuche zwar die beste Kombination der PERL- und der POSIX-Syntax hinzubekommen, aber Änderungen, bzw. Erweiterungen wären schon möglich. (falls jemand eine Idee hat, wie man z.B. alles als
ASCII und
Unicode anlegt und dann einen "Umschalter" integriert)
Ein Therapeut entspricht 1024 Gigapeut.