![]() |
Set of WideChar (TDynamicCharSet)
Liste der Anhänge anzeigen (Anzahl: 1)
So, ich hab mir heute mal ein WideChar-Set zusammengebastelt,
da ja die normalen Sets nicht mit Unicode arbeiten. Ja, ich kenn IWidecharSet von Peter Below ( ![]() allerdings hab ich damit ein kleines Problem. Hauptsächlich, daß dieses immer mehr als 8 KB pro Set belegt und ich für ein Projekt mehrere/viele Sets benötige. Also ist ein "Set" mit dynamischer Speicherverwaltung entstanden. Dieses belegt pro "Set" jeweils etwa 8 Byte bis 8,02 KB, zuzüglich einem Standardencoding für's Ansi, wenn man eines angibt und dank der Referenzzählung bei dynamischen Arrays und Interfaces wird beim Kopieren sowieso nochmal Speicher eingespart. Zusätzlich wurde es als Operator-Record ausgelegt, anstatt als Objekt/Interface: Welche den Vorteil hat, daß es grundsätzlich fast wie ein "normales" (Ansi)CharSet verwendbar ist. > Leider stellen die Operatoren keinen IN-Operator zur Verfügung. :? Aber abgesehn von IN und den Functionen Include und Exclude (welche sich aber leicht zusammenstellen lassen) wird alles Mögliche unterstützt. Die Operatoren + - und *, sowie die Vergleichsoperatoren < <= = >= > <> und zusätzlich noch OR, AND, XOR und NOT. Nja, und dann gibt es noch einige weitere Befehle und Typumwandlungen... Inzwischen wurde auch ein Enumerator verbaut, so daß For-In-Schleifen genutzt werden können.
Delphi-Quellcode:
Var C: Char;
For C in HexNumerals do S := S + C; // S = '0123456789ABCDEFabcdef' // da HexNumerals = ['0'..'9', 'A'..'F', 'a'..'f']
Delphi-Quellcode:
Das Ganze setzt natürlich mindenstens Delphi 2009 voraus,
// Achtung: dieser Code wurde einen wesentlichen/wichtigen Anteil reduziert
TSetRelation = (srEqual, srIsSubset, srIsSuperset, srOverlap, srDisjunct); TDynamicCharSet = Record Private _Map: TDCSDynMap; _Encoding: TEncoding; Public Property DefaultEncoding: TEncoding; Procedure Fill(CharSet: TSysCharSet; Encoding: TEncoding); Procedure Fill(CharSet: TDynamicCharSet); Procedure Fill(CharSet: TDCSMap); Procedure Fill(Char: AnsiChar; Encoding: TEncoding); Procedure Fill(Char: WideChar); Procedure Fill(First, Last: AnsiChar; Encoding: TEncoding); Procedure Fill(First, Last: WideChar); Procedure Fill(S: RawByteString; Encoding: TEncoding; AllowCharGroups: Boolean); Procedure Fill(S: UTF8String; AllowCharGroups: Boolean); Procedure Fill(S: UnicodeString; AllowCharGroups: Boolean); Procedure FillAll; Procedure Invert; Procedure Clear; Function IsEmpty: Boolean; Function IsFull: Boolean; Function LowChar: WideChar; Function HighChar: WideChar; Function CountChars: Integer; Function GetAsSysCharSet(Encoding: TEncoding): TSysCharSet; Function GetAsMap: TDCSMap; Function GetAsAnsiString(Encoding: TEncoding): RawByteString; Function GetAsUTF8String: UTF8String; Function GetAsString: UnicodeString; Function GetAllChars: UnicodeString; Function ContainsAnyChar (S: RawByteString; Encoding: TEncoding): Boolean; Function ContainsAnyChar (S: UTF8String): Boolean; Function ContainsAnyChar (S: UnicodeString): Boolean; Function ContainsAllChars (S: RawByteString; Encoding: TEncoding): Boolean; Function ContainsAllChars (S: UTF8String): Boolean; Function ContainsAllChars (S: UnicodeString): Boolean; Function ContainsOnlyThisChars(S: RawByteString; Encoding: TEncoding): Boolean; Function ContainsOnlyThisChars(S: UTF8String): Boolean; Function ContainsOnlyThisChars(S: UnicodeString): Boolean; Function Compare (CharSet: TSysCharSet; Encoding: TEncoding): TSetRelation; Function Compare (CharSet: TDynamicCharSet): TSetRelation; Function Contains(Char: AnsiChar; Encoding: TEncoding): Boolean; Function Contains(Char: WideChar): Boolean; Function Compare (First, Last: AnsiChar; Encoding: TEncoding): TSetRelation; Function Compare (First, Last: WideChar): TSetRelation; Function Compare (S: RawByteString; Encoding: TEncoding): TSetRelation; Function Compare (S: UTF8String): TSetRelation; Function Compare (S: UnicodeString): TSetRelation; Procedure Include (CharSet: TSysCharSet; Encoding: TEncoding); Procedure Include (CharSet: TDynamicCharSet); Procedure Include (Char: AnsiChar; Encoding: TEncoding); Procedure Include (Char: WideChar); Procedure Include (First, Last: AnsiChar; Encoding: TEncoding); Procedure Include (First, Last: WideChar); Procedure Include (S: RawByteString; Encoding: TEncoding); Procedure Include (S: UTF8String); Procedure Include (S: UnicodeString); Procedure Exclude (CharSet: TSysCharSet; Encoding: TEncoding); ... Procedure Exclude (S: UnicodeString); Procedure Intersect (CharSet: TSysCharSet; Encoding: TEncoding); ... Procedure Intersect (S: UnicodeString); Procedure ExclusiveOr(CharSet: TSysCharSet; Encoding: TEncoding); ... Procedure ExclusiveOr(S: UnicodeString); Function GetEnumerator: TDCSEnumerator; Public Class Operator Implicit(CharSet: TSysCharSet): TDynamicCharSet; Class Operator Implicit(CharSet: TDCSMap): TDynamicCharSet; Class Operator Implicit(S: RawByteString): TDynamicCharSet; Class Operator Implicit(S: UTF8String): TDynamicCharSet; Class Operator Implicit(S: UnicodeString): TDynamicCharSet; Class Operator Explicit(CharSet: TSysCharSet): TDynamicCharSet; Class Operator Explicit(CharSet: TDCSMap): TDynamicCharSet; Class Operator Explicit(S: RawByteString): TDynamicCharSet; Class Operator Explicit(S: UTF8String): TDynamicCharSet; Class Operator Explicit(S: WideString): TDynamicCharSet; Class Operator Explicit(S: UnicodeString): TDynamicCharSet; Class Operator Explicit(CharSet: TDynamicCharSet): TSysCharSet; Class Operator Explicit(CharSet: TDynamicCharSet): TDCSMap; Class Operator Explicit(CharSet: TDynamicCharSet): RawByteString; Class Operator Explicit(CharSet: TDynamicCharSet): UTF8String; Class Operator Explicit(CharSet: TDynamicCharSet): WideString; Class Operator Explicit(CharSet: TDynamicCharSet): UnicodeString; Class Operator Equal (Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator NotEqual (Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator LessThan (Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator LessThanOrEqual (Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator GreaterThan (Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator GreaterThanOrEqual(Oper1, Oper2: TDynamicCharSet): Boolean; Class Operator Add (Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator Subtract (Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator Multiply (Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator BitwiseAnd(Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator BitwiseOr (Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator BitwiseXor(Oper1, Oper2: TDynamicCharSet): TDynamicCharSet; Class Operator LogicalNot(CharSet: TDynamicCharSet): TDynamicCharSet; End; Const Signs: TDynamicCharSet = (); // ['-', '+'] DecimalDigits: TDynamicCharSet = (); // ['0'..'9'] Numbers: TDynamicCharSet = (); // Signs + DecimalDigits FloatChars: TDynamicCharSet = (); // Numbers + [DecimalSeparator] SciFloatChars: TDynamicCharSet = (); // FloatChars + ['e', 'E'] OctalNumerals: TDynamicCharSet = (); // ['0'..'7'] HexNumerals: TDynamicCharSet = (); // ['0'..'9', 'A'..'F', 'a'..'f'] FirstIdentifierChars: TDynamicCharSet = (); // ['A'..'Z', 'a'..'z', '_'] IdentifierChars: TDynamicCharSet = (); // ['A'..'Z', 'a'..'z', '0'..'9', '_'] EditOperations: TDynamicCharSet = (); // [^C, ^V, ^X, Backspace] AsciiControlChars: TDynamicCharSet = (); // [#0..#31, #127] AsciiChars: TDynamicCharSet = (); // [#0..#127] AsciiTextChars: TDynamicCharSet = (); // [Tab, LF, CR, Space..#127] // The following constants are dependent on the existing unicode system of the OS. ControlChars: TDynamicCharSet = (); // [#1..#$1F, #$7F..#$9F, #$70F and other] BlankChars: TDynamicCharSet = (); // [#9, ' ', #160, #$3000, #$FEFF] SpaceChars: TDynamicCharSet = (); // [#9..#$D, ' ', #$85 and other] Digits: TDynamicCharSet = (); // '0123456789¹²³' and other digit chars HexDigits: TDynamicCharSet = (); // HexNumerals + Bold:HexNumerals Numeric: TDynamicCharSet = (); // copy of "Digits" Letters: TDynamicCharSet = (); // LowerCaseLetters + UpperCaseLetters LowerCaseLetters: TDynamicCharSet = (); // all lowercase characters UpperCaseLetters: TDynamicCharSet = (); // all uppercase characters Alpha: TDynamicCharSet = (); // any linguistic character AlphaNum: TDynamicCharSet = (); // Alpha + Digits NonAlphaNum: TDynamicCharSet = (); // AllChars - AlphaNum Punctuation: TDynamicCharSet = (); // '!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~' and other Printable: TDynamicCharSet = (); // graphic characters and blanks AllChars: TDynamicCharSet = (); // Printable + ControlChars aber notfalls könnte man es auch unter Delphi 2006, 2007, sowie Turbo Delphi zu laufen bekommen. PS: nicht über meine Konstanten wundern ... nach außen Konstante und nach innen nicht, da es doch typisierte Konstanten sind, welche in Delphi ja eh keine "echten" Konstanten sind. :angel2: Und wenn falls es wer mal braucht, dann ließe sich bestimmt auch noch ein "Set of Integer" erstellen, mit einer zusätzlichen dynamischen Untergrenze, allerdings sollten dann die Werte nicht all zu "weit" auseinander liegen, wobei es auch dafür eine Lösung gäbe ... also mehrere Wertebereiche/Sets in Einem. Jetzt aber noch ein Problem Und zwar scheint es irgendwo einen Bufferoverrun oder Dergleichen zu geben. :cry: Schon bei der Initialisierung der Konstanten kommt es offiziell zu einem OutOfMemory (in D2009+), welches allerdings davon stammt, daß der Speichermanager (FastMM) defekte Verwaltungsdaten so anzeigt. (hab über 'ne Strunde nach dem Speicherleck gesucht und mich gleichzeitig gewundert, warum der Taskmanager meint es wäre noch genügend frei) Es wäre also schön, wenn da noch mit jemand reingucken könnte und mir eventuell einen Tipp gibt. Bin den Code jetzt schon mehrmals nochmal komplett durchgegangen und konnte keinen noch Fehler finden, welcher dafür verantwortlich sein könnte. :? [edit] Grad gemerkt, daß hier die Bereichsprüfung nicht aktiv war (dabei hatte ich es doch in den Optionen aktiviert :shock: ) na mal sehn, was sich jetzt findet. [edit 10.12.2009 v1.1] Was so ein kleines -1 alles ausrichten kann, :wall: aber nun gibt es schonmal keine Exceptions mehr. :-D Jetzt kann ich endlich gucken, ob es auch wirklich so arbeitet, wie geplant. [edit 13.01.2010 v1.2] das Problem mit dem nichtinitialisiertem Standardencoding ( Beitrag #3 bis #6 ) wurde behoben [add 10.02.2010 v1.3] kleinere Erweiterungen und Änderungen an den Konstanten ... siehe Beitrag #7 sowie Fehlerbereinigung und hinzugefügter Enumerator ... siehe Beitrag #8 [edit 11.02.2010 v1.4] Eingangspost überarbeitet und kleine Neuerungen hinzugefügt ... siehe letzes Edit in Beitrag #8 [edit 12.02.2010 v1.5] schonwieder was Neues > siehe Beitrag #9 [edit 13.02.2010 v1.6] 'nen kleinen Fehler ausgebesserst, welcher bei einem Fill das DefaultEncoding nicht richtig übernahm und so zu einer Exception führte. Auserdem wurde .FullClear und .ReadOnly eingefügt. Leider wird der ReadOnly-Status mitkopiert, wenn man ein SET per := kopiert. [edit 13.02.2010 v1.7] Fehlerbeseitigung (siehe #15) [edit 08.04.2010 v1.8] restliche Fehler beseitigt ... alle neuen Prüfungen meinen jetzt es sei alles OK [edit 33.04.2010 v2.2] Ups, hab grade gemerkt, daß ich die Fehlerbeseitigung dieses saublöden Compilerfehlers ![]() ![]() noch nicht hochgeladen hatte. :oops: |
Re: Set of WideChar (TDynamicCharSet)
Da es grade eine Frage zur Speicherverwaltung gab:
Zitat:
Es muß hier also nichts an Speicher, bzw. Instanzen reserviert, erstellt oder freigegeben werden. :angel: und im Prinzip geht auch sowas:
Delphi-Quellcode:
if TDynamicCharSet(['#', '$']).Contains('a') then
beep; if TDynamicCharSet('#$a..z梣儿梈棅棋㌇').Contains('a') then beep; |
Re: Set of WideChar (TDynamicCharSet)
Zur Speicherverwaltung: Ah ja, hatte übersehen, dass du ja mit records arbeitest :)
Zitat:
Delphi 2010. Neues VCL-Projekt. TButton hinzugefügt. OnClick:
Delphi-Quellcode:
Start. Button drücken. Freuen:
procedure TForm1.Button1Click(Sender: TObject);
begin TDynamicCharSet(['#', '$']).Contains('$'); end;
Code:
Bis TDynamicCharSet.Fill(Const S: RawByteString; Encoding: TEncoding = nil) geht also alles gut.
Im Projekt Project1.exe ist eine Exception der Klasse EAccessViolation mit der Meldung 'Zugriffsverletzung bei Adresse 00418441 in Modul 'Project1.exe'. Lesen von Adresse 0574C08C' aufgetreten.
Stack-Trace: DynSet.TDynamicCharSet.Fill('#$', nil) DynSet.TDynamicCharSet.Fill(['#'..'$'], nil) DynSet.TDynamicCharSet.&op_Explicit(['#'..'$']) Unit1.TForm1.Button1Click(???) Dort wird dann CheckEncode(nil) aufgerufen, wobei Encoding auf _Encoding gesetzt wird, was hier merkwürdigerweise nicht genullt ist, sondern zufällige Werte beinhaltet: (FIsSingleByte:True; FMaxCharSize:1589654467) Die nächste Zeile (229) crasht dann erwartungsgemäß. Scheinbar wird bei diesem expliziten Cast das Record nicht mit Nullen gefüllt :shock: Edit: grade nochmal im Debugger überprüft: Beim Aufruf von &op_Explicit ist Result._Encoding schon direkt zu Beginn nicht nil, sondern mit (FIsSingleByte:True; FMaxCharSize:1589654467) gefüllt... Könnte das noch jemand unter Delphi 2010 testen und bestätigen bitte? |
Re: Set of WideChar (TDynamicCharSet)
Hmmm, also in D2009 geht es ... werd' es nächte Woche mal im D2010 probieren (hab's grad nich dabei)
|
Re: Set of WideChar (TDynamicCharSet)
:shock:
Ich hab grade festgestellt, dass das _Encoding-Feld überhaupt nicht :!: initialisiert wird! Selbst solch ein Code:
Delphi-Quellcode:
zeigt beim Ausführen mit dem Debugger, dass cs nach der Zuweisung Müll in _Encoding stehen hat:
procedure TForm1.Button1Click(Sender: TObject);
var cs: TDynamicCharSet; begin cs := 'ab'; if cs.Contains('a') then Beep; end;
Code:
Daher endet es auch wieder in einer AV, wenn ich die Zuweisung in ein
(FIsSingleByte:True; FMaxCharSize:1589654467)
Delphi-Quellcode:
ändere.
cs := ['a', 'b'];
Also irgendwas scheint da schief zu laufen :wall: Wär mal jemand mit D2010 so freundlich? :zwinker: |
Re: Set of WideChar (TDynamicCharSet)
So, jetzt konnte ich mich endlich mal um diese Baustelle kümmern...
Es stellte sich nur raus, daß es "glücklicher" Weise kein spezifisches D2010-Problem war, sondern einfach nur daran lag, wie/wo man die Variable deklariert. Bei meinen Tests war es rein zufällig so, daß die Variable entweder durch Delphis Compilermagic initialisiert wurde oder zufällig der Stack noch genullt war. Ist natürlich klar, daß TEncoding (also ein Objekt) nicht automatisch initialisiert wird ... das hatte ich leider nur ein kleinbissl übersehn. :oops: Ich hoffe mal, daß ich jetzt alle Eintrittspunkte erwischt hab und derartig nicht initialisierte Werte nun erkannt und entsprechend behandelt werden. > neuer Code > siehe Post #1 |
Re: Set of WideChar (TDynamicCharSet)
Da ich in einem Projekt bessere Funktionalitäten (siehe letzen Abschnitt dieses Posts), sowie spezifiziertere "Standard"-Sets benötigte
und bevor ich getrennt nochmals eine Erzeugungsroutine schreibe, hab ich diese direkt ins Projekt mit eingefügt. Und auch gleich noch die Gelegenheit genutzt, um dort etwas besser zu sortieren, bzw. aufzuräumen. Es gibt jetzt ein myset.GetAllChars, welches wirklich jedes Zeichen im Set auch im Result liefert und nicht so wie z.B. myset.GetString, bzw. String(myset), wo eine (möglichst) verkürzte Liste rauskommt. Zusätzlich wurde die interne Speicherverwaltung an einigen Ecken etwas fehlerunanfälliger umgestellt. Und man kann jetzt die "Konstanten" auch nachträglich nochmals neu erzeugen. Dieses macht vorallem dann Sinn, da in einigen systemspezifische Abhängigkeiten enthalten sind und z.B. bei Änderung von System.DecimalSeparator das Dezimalzeichen in FloatChars nicht mehr stimmen würde. Außerdem bekam die Set-"Klasse" ein paar neue Methoden spendiert. So ist es jetzt leicht möglich einen Zeichenbereich (CharRange) gleichzeitig zu verarbeiten. Folgendes würde also alle Zeichen von a bis z in das Set einfügen.
Delphi-Quellcode:
OK, sowas ging über Umwege auch vorher schon,
myset.Include('a', 'z');
Delphi-Quellcode:
aber der direkte Weg arbeitet wesentlich optimaler.
myset.Include(FirstChar + '..' + LastChar);
|
Re: Set of WideChar (TDynamicCharSet)
Diejenigen Zwei, welche das heute/vorhin runtergeladen haben ... bitte "dringend" updaten.
Hatte leider 'nen Fehler an falscher Stelle behoben und es somit nicht grad verbessert. Leider fiel der Fehler nicht direkt auf, da dieser Codeteil seltener verwendet wird. In der Resitze-Prozedur hatte ich hier das vermeintlich falsche i2 durch i ersetzt
Delphi-Quellcode:
obwohl es andersrum richtig gewesen wäre.
If (i = 0) and Assigned(_Encoding) Then i2 := 1;
SetLength(_Map, i); // set length and make unique
Delphi-Quellcode:
Somit wurden eventuell höhere Bits ausversehn gelöscht, wenn man 2 Sets irgenwie miteinander verrechnete. :wall:
If (i2 = 0) and Assigned(_Encoding) Then i2 := 1;
SetLength(_Map, i2); // set length and make unique Nja, wenigstens fiel der Fehler grad auf, als ich eben meinen ersten Allerenumerator gebastelt hatte und mich über falsche Ergebnisse wunderte. So, Fehler behoben und ab nur kann man, dank des Enumerators, auch noch das nette For-In benutzen. :firejump:
Delphi-Quellcode:
[edit 11.02.]
Var C: Char;
For C in HexNumerals do S := S + C; // S = '0123456789ABCDEFabcdef' // da HexNumerals = ['0'..'9', 'A'..'F', 'a'..'f'] Code etwas aufgeräumt und neue Funktionen: LowChar = niedrigstes Zeichen im Set HighChar = höchstes Zeichen im Set CountChars = Anzahl der Zeichen im Set ContainsAnyChar = prüft ob irgendeines der Zeichen des SETS im String vorkommt ContainsAllChars = prüft alle Zeichen des SETS im String mindestens einmal vorkommen ContainsOnlyThisChars = prüft ob alle Zeichen des Strings im SET vorkommen (nur der Name gefällt mir irgendwie nicht :? ) [add] Es gibt nun auch eine Shift-Funktion (siehe Demo-Projekt), aber fragt mich bitte nicht, wofür man diese gebrauchen kann. :stupid: |
Re: Set of WideChar (TDynamicCharSet)
Neben den Operatoren SHL und SHR und den zugehörigen Funktionen .ShiftDown und .ShiftUp,
haben es jetzt auch noch .Lower, .Upper und .CaseLess, sowie .toLower, .toUpper und .toCaseLess reingeschafft.
Delphi-Quellcode:
Jetzt dürfte wohl alles drin sein, welches man mit Chars/CharSets machen kann. :-D
Var X: TDynamicCharSet;
X := ['a'..'w']; X := X shr 3; // X = ['d'..'z'] X := ['a'..'w', 'ä']; X := X shl 29; // X = ['D'..'Z', 'Ç'] X := ['a'..'w', 'ä']; X.Upper; // X = ['A'..'W', 'Ä'] X := ['a'..'w', 'Ä']; X.CaseLess; // X = ['A'..'W', 'a'..'w', 'Ä', 'ä'] X := ['a'..'w']; If X.toUpper.Contains('A') Then JaIchBinDrin; If X.toUpper >= ['B'] Then JaIchBinAuchDrin; // zu ">=": ['B'] ist ja ein SubSet von ['A'..'W'] X := ['a'..'w']; // -X = alle (Unicode)Zeichen, ohne ['a'..'w']
Delphi-Quellcode:
Sowas braucht zwar keiner, aber man kann es dennoch machen. :angel2:
X := ['0'..'9', 'a'..'f', 'A'..'F'];
X := (X * ['0'..'9']) shl 48 + (X * ['A'..'F']) shl 55 + (X * ['a'..'f']) shl 87; // oder X := (X and ['0'..'9']) shl 48 or (X and ['A'..'F']) shl 55 or (X and ['a'..'f']) shl 87; // X = [#0..#15] // // #0 = '0' #1 = '1' #9 = '9' #10 = 'A' or 'a' #15 = 'F' or 'f' |
Re: Set of WideChar (TDynamicCharSet)
OK, daß ich geschwindigkeitsmäßig nicht an Peters IWidecharSet rankomm, war ja zu erwarten
- keine assembleroptimierten Codeteile - und die dynamische Speicherverwaltung benötigt auch mehr Abfragen, Bereichsprüfungen und Kopierarbeiten Allerding bin ich positiv überrascht, daß es vorallem beim Erstellen/Erstzuweisung und beim Auslesen garnicht mal so langsam ist, wie ich befürchtet hab. Dagegen ist aber der Speicherverbrauch im Einsatz wohl um weit mehl als 50% geringer und im Extremfall (beim Zeichenvorrat der deutschen Sprache) würden bis zu 99% gespart. OK, daß meine Codes auch in der EXE weniger Platz verbrauchen, ist nicht wirklich von Belangen, denn es fällt nur so sehr auf, weil die Text-Anwendungen sehr klein sind. (ob es nun 40 KB oder 50 KB mehr sind, im Vergleich zum TSysCharSet) Mein SET hat jetzt auch noch ein .ReadOnly bekommen, aber da es keinen Kopier-Klassen-Operator gibt, wird dieser Status bei := leider mitkopiert.
Delphi-Quellcode:
// hier ist dann auch VarSet als ReadOnly deklariert
VarSet := ConstSet; // so ginge es aber VarSet.Fill(ConstSet);
Code:
So, das sollte jetzt hoffentlich vorerst einmal das Ende des täglichen Updatemarathons sein. :angel2:
***** TDynamicCharSet *****
size test [a..z]: 100.000 sets - 3,81 MB - 0,25 sec size test [#$FFFF]: 100.000 sets - 786,21 MB - 0,55 sec high-low fill test: 1,34 sec low-high fill test: 1,31 sec low exitst read test: 0,64 sec low non exitst read test: 0,64 sec high non exitst read test: 0,66 sec ***** IWidecharSet ***** size test [a..z]: 100.000 sets - 785,83 MB - 0,47 sec size test [#$FFFF]: 100.000 sets - 785,83 MB - 0,52 sec high-low fill test: 0,11 sec low-high fill test: 0,14 sec low exitst read test: 0,45 sec low non exitst read test: 0,89 sec high non exitst read test: 0,48 sec ***** TSysCharSet / Set of AnsiChar ***** size test [a..z]: 100.000 sets - 3,05 MB - 0,015 sec size test [#$FFFF]: not supported high-low fill test: 0,02 sec low-high fill test: 0,02 sec low exitst read test: 0,08 sec low non exitst read test: 0,08 sec Für mein anderes Projekt scheinen nun erstmal keine weiteren Wünsche/Notwendigkeiten mehr offen zu sein. |
Re: Set of WideChar (TDynamicCharSet)
Moin, ich wollte mal fragen, ob überhaupt jemand diese sogenannten Surrogate Pairs nutzt und ob es sich lohnen würde diese mit auszuwerten?
Die obere Grenze des Arrays läßt sich ja leicht erweitern, welches aber nichts am bisherigen Speicherverbauch ändern würde. (abesehn von invertierten Sets, welche dann natürlich doppelt so groß wären) Einige der Pascalcodes in ASM flottere ASM-Codes umzuwandeln werde ich vorerst noch lassen. (noch mindestens bis nach den Testläufen eines anderen Projektes, welches diese Sets nutzt) |
Re: Set of WideChar (TDynamicCharSet)
Nur was kleines Kosmetisches:
Hmmm, es scheint wohl keiner die Surrogate Pairs zu nutzen oder weiß erst garnicht was das ist. (dabei sind die voll genial ... ich wollte schon immer mal Dominosteine als Schriftzeichen haben :stupid: ) |
Re: Set of WideChar (TDynamicCharSet)
So, einiges der neuen Version (2.x) wurde ja inzwischen immer mal wieder in der alten Version (1.x) integriert, aber nun isses mal so weit.
Eigentlich isses ja 'ne Version 3.x, aber der ältere überarbeitet Entwurf war viel zu umständlich, so daß ich gleich nochmal neu anfing und demnach die Versionsnummer öffentlich erst garnicht weiterzählte. :angel2: Hab das komplette Speichermanagement umgestellt, so daß das alte Initialisierungsproblem (siehe 6#) garnicht mehr vorkommen kann und ich diesbezüglich weniger Aufwand hab, um dieses abzufangen. - das SET ist jetzt noch 'nen Haut speichersparender - und die "Konstanten" werden nicht mehr beim Programmstart erstellt, sondern erst wenn benötigt - das mit den Konstanten wurde in der alten Version 1.7 wieder zurückgebaut (gab da 'n kleines Problem und ich hab's halt nur noch in einer Version suchen und beheben wollen) Außerdem besteht der Record jetzt nur noch aus dem dynamischen Array, so daß dieses jetzt seitens Delphi wie ein Integer verwaltet werden kann, bzw. wie ein einfaches dynamisches Array, welches z.B. eine optimalere Übergabe als Parameter ermöglicht (paßt ja nun in ein Register rein). Zusätzlich sind auch schon Teile etwas optimiert (häßliches ASM eben) Nja, so einige manuelle Test verliefen erfolgreich. Aber 'nen "richtigen" Unittest muß ich noch fertigstellen, um da ganz sicher zu sein. (sind ja nur noch ~31 Prozeduren/Funktionen zu testen, von den fast 140 Öffentlichen) Im Post #1 befindet sich nun also eine Zip, mit der "alten" 1.7 und der "neuen" 2.0. Falls jemand Fehler entdeckt, so möge Er/Sie es bitte melden. :stupid: |
Re: Set of WideChar (TDynamicCharSet)
:wall: :wall: :wall: :wall:
Wißt ihr wie vieß ein winziger Fehler in einer Testroutine sein kann? Hatte zwar vorher unmassen an Möglichkeiten in der .Compare-Routine erfolgreich getestet, aber zwei winzige Sondefälle übersehn. In der Annahme, daß .Compare also funktioniert, ging ich nun also davon aus, daß etwas Anderes 'ne Macke hatt, welche ich einfach nicht fand. :? Also Compare war futsch, das Andere ging vermutlich (jedenfalls bis dahin, wo ich es versuchte zum Laufen zu bringen). Im Unitstest hab ich jetzt erstmal die beiden Wichigstens Vergleiche/Prüfungen (Equal und Compare) durch selbstprüfende Varianten ersetzt, welche weiterhin .Compare nutzen. Somit wird weiterhin Compare geprüft (auch dieser gemeine Sonderfall, aber es gibt bei den Püfungen keine Falschmeldungen mehr. :) Nja, ich hoofe mal die letzen Macken demnächst wegzubekommen, aber da ich die nächsten 2 Wochen etwas ausgelastet und kurz angebunden bin, werd' ich nicht viel Zeit hierfür haben. :? Meine aktuellen Codes sind dennoch oben mit angehangen und die 3 Blöcke mit dem {} davor, in der UnitTest.dpr, sind die mir bekannten Problemstellen. |
Re: Set of WideChar (TDynamicCharSet)
So, alle bekannten Fehler wurden endlich beseitigt. (Download siehe oben)
Codeoptimierungen werde ich jetzt aber nicht mehr vornehmen können. (sowas muß mindestens bis übernächste Woche warten, also bis ich wieder von der LBM zurück bin) |
Re: Set of WideChar (TDynamicCharSet)
Joar, was soll ich sagen?
Ich hatte inzwischen mal (hoffentlich) die letzen Fehler ausgemerzt, welche nach Reperatur der Prüffunktionen aufgetaucht sind. Nachfoldendes ist unwichtig ... steht nur hier , damit ich den Link nicht vergeß. :roll: Außerdem hab ich es auch mal im CodeCentral zur Diskusion gestellt ... mal sehn ob da noch jemand was dazu sagt. ![]() ![]() |
Re: Set of WideChar (TDynamicCharSet)
Zitat:
Unavailable Submission Sorry, you don't have access to this submission. Please see similar submissions for 3rdRail and Source Code, and other submissions by Frank Semmling. |
Re: Set of WideChar (TDynamicCharSet)
OK, die Frage ob du im EDN eingeloggt bist, hat sich dort über's Forum schon geklärt,
aber sonst wüßte ich nicht ob und wo ich da was "freigeben" oder umstellen muß? :gruebel: |
Re: Set of WideChar (TDynamicCharSet)
Wenn du mal auf eine meiner Submissions gehst
![]() Zitat:
Bei den Eigenschaften der Submission habe ich bei Copyright: "No significant restrictions" und bei Terms "Embarcadero use at your own risk disclaimer" angegeben. |
Re: Set of WideChar (TDynamicCharSet)
Ups, da hatte ich doch glatt vergessen die letzte Version hochzuladen,
in welcher dieser saublöde Compilerfehler (defekte Referenzzählung ![]() behoben/umgangen wurde. Und nun noch ein kleiner "Gag": Das kleinste (vom Code her) und schnellste WideCharSet der Welt. :lol:
Delphi-Quellcode:
Es kann nicht viel, kennt kein Ansi, aber es ist dafür klein und komplett fehlerunanfällig. :angel:
Type TWideCharRec = Record
Lo: AnsiChar; Hi: Byte; End; TTinyWideCharSet = Record Sets: Array[Byte] of TSysCharSet; Procedure Include(C: WideChar); Inline; Procedure Exclude(C: WideChar); Inline; Function Test (C: WideChar): Boolean; Inline; Procedure Clear; Inline; End; Procedure TTinyWideCharSet.Include(C: WideChar); Begin System.Include(Sets[TWideCharRec(C).Hi], TWideCharRec(C).Lo); End; Procedure TTinyWideCharSet.Exclude(C: WideChar); Begin System.Exclude(Sets[TWideCharRec(C).Hi], TWideCharRec(C).Lo); End; Function TTinyWideCharSet.Test(C: WideChar): Boolean; Begin Result := TWideCharRec(C).Lo in Sets[TWideCharRec(C).Hi]; End; Procedure TTinyWideCharSet.Clear; Var i: Byte; Begin For i := 0 to 255 do Sets[i] := []; End; |
Alle Zeitangaben in WEZ +1. Es ist jetzt 23:17 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz