![]() |
AW: Codierung/Decodierung von Umlauten
Na der Code ist schon ziemlich aufwändig. Die Statemachine muss man so nicht machen, eine einfache Fallunterscheidung und ein Lookupstring für die Literale reicht auch.
|
AW: Codierung/Decodierung von Umlauten
Er umfasst ja auch die komplette Syntax, also nicht nur auf das \u bezogen, und das auch noch ganz "einfach" in Form einer State-Machine ("blind" übersetzt, ohne groß über das Ergebnis nachzudenken oder etwas zu "optimieren").
Man kann es auch locker in vielleicht 5-15 Zeilen zusammenfassen. (je nach dem was man von der Syntax alles implementiert) |
AW: Codierung/Decodierung von Umlauten
So würde ich das machen. Ich habe aber kein XE, insofern kann ich das nicht testen.
Delphi-Quellcode:
Ich will damit den Code von Sir Rufo nicht schmälern, aber das ist hier ja auch ein Programmiererforum, und da kann man ja eine andere/kürzere Möglichkeit aufzeigen. Ich persönlich finde zudem den Statemachine-Code schwer zu lesen und noch schwerer zu verstehen. Aber das ist ja Ansichtssache.
Function DecodeJScriptString(Const text : String) : String;
const Literals = '\/"''btnbfr'; LiteralTranslations='\/"''#8#9#10#11#12#13'; Var i, p, length : Integer; c : Char; Function ByteToIso8859(b : Byte) : String; Begin result := TEncoding.Default.GetString(TArray<Byte>.Create(b)); End; Function Unicode(w : Word) : String; Begin result := TEncoding.Unicode.GetString(TArray<Byte>.Create(Lo(w), Hi(w))); End; Function OctToInt(Const Value: string): integer; begin result := 0; for c in value do result := result * 8 + ord(c)-ord('0'); end; Function HexToInt(Const Value: string): integer; begin result := StrToInt('$'+Value); end; Begin i:=1; length := length(text); Result := ''; while i<=l do begin if (text[i]<>'\') or (i=l) then result := result + text[i] else begin inc(i); c := Text[i]; p := Pos(c,Literals); if p>0 then result := result + LiteralTranslations[p] else case c of '0'..'3' : begin result := result + ByteToIso8859(OctToInt(Copy(text,i,3))); inc(i,2); end; 'x' : begin result := result + ByteToIso8859(HexToInt(Copy(text,i+1,2))); inc(i,2); end; 'u' : begin result := result + Unicode(HexToInt(Copy(text,i+1,4))); inc(i,3); end; end end; inc(i); end; end; |
AW: Codierung/Decodierung von Umlauten
Ich fühle mich auch nicht "geschmälert" (spätestens morgen hätte ich eine Alternativ-Umsetzung von dir gefordert ;))
Der Code hat mE noch einen Fehler wenn der String mit einem \ beginnt ;) Des weiteren werden keine Fehler in falschen Strings gefunden "Das \0AA ist fehlerhaft" (beides Kleinigkeiten die sich fix beheben lassen) Sieht ansonsten gut aus und man könnte das eine oder andere in meinen Code übernehmen. Wäre ein schönes Beispiel für den Vergleich zwischen Statemachine (ist eigentlich eine Spar-Statemachine) und klassischer Umsetzung. Dabei sollte die sich so ähnlich wie möglich sein, damit die eigentlichen Unterschiede klarer hevorstehen. (Ich bastle mal morgen dran herum :)) EDIT Mein Code erkennt auch nicht alle unkorrekten Strings, werde ich noch nachbessern :) |
AW: Codierung/Decodierung von Umlauten
Da postet man mal kurz etwas, geht arbeiten und kaum ist man zu Hause, erkennt man, dass aus dem Initial-Post ein 2 Seiten Topic geworden ist, der mehrere Komplettlösungen anbietet.
Das ist einfach klasse! Jetzt werde ich mir mal die Ansätze genauer anschauen - will ja schließlich noch was lernen. Nochmals DANKE! |
Alle Zeitangaben in WEZ +1. Es ist jetzt 19:48 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz