Neee, es ist eine Klasse für die Auswertung von erweiterten Perl-Compatible Regular Expressions.
Und in dem Baum wird praktich der ganze Ausdruck entsprechend abgelegt, wobei diese Charsets eben eines er Elemente darstellt.
Nur bei diesem Rucksackproblem hätte ich dann noch einige Probleme:
Mehrere Klasse verfügen über selbe Zeichen, welche aber praktisch jeweils mehrfach vorkommen können,
außerdem entspricht die Anzahl der Zeichen nicht dem Platzverbrauch.
in [\0-\x{FFFF}] würde [:lower:] reinpassen ... wenn ich jetzt alle "Kleinbuchstaben" entferne, dann bleiben zwar weniger Zeichen im restlichen Set zurück, aber der Platzverbrauch würde durch die Optimierungen wie "-" (Gruppen) insgesamt größer.
Hab jetzt mal durchgezählt und ich komme wohl etwa auf 47 Zeichen-Klassen ... sagen wir also einfach mal 50.
Davon noch die Intertierten, das macht dann 100 ... also mindesten 2^100 Kombinationen und das Ganze dann nocheinmal, da ja das ganze Set auch nochmal invertiert sein könnte.
> Das wären dann also 2 * 2^100 Kombinatonen von 8 KB großen Datenblöcken, welche da so verglichen und verrechnet werden müßten.