![]() |
Escape sequenzen ersetzen
Hallo,
kurze Schilderung meines Problems: Ich erhalte von einem Windows - Dienst (in Python geschrieben) über UDP eine Zeichenkette, die ich in Delphi weiter verarbeiten möchte. Um übertragungsprobleme zu vermeiden, wurden in der Zeichenkette die Sonderzeichen durch \x + Hex Wert ersetzt. So ergibt z.B. 'äöü' die Zeichenkette '\xe4\xf6\xfc'. Gibt es eine Möglichkeit, die originale Zeichenkette wiederherstellen? Danke im voraus Manuel |
AW: Escape sequenzen ersetzen
Ja, das sollte nicht so schwer sein.
Wie wird denn das Backslash selbst escapted? |
AW: Escape sequenzen ersetzen
Das Backslash muss glaube ich nicht escaped werden, weil '\x' für das escapen hergenommen wird.
Ich kann mich aber auch irren... |
AW: Escape sequenzen ersetzen
spontan würde ich \\ für \ vermuten ... halt der normale C-Style
und Zurück: Zeichencode auslesen und nach '\x'+2xHex umwandeln, außer bei #0 = '\0' oder #10 = '\n' oder '\' = '\\' usw. |
AW: Escape sequenzen ersetzen
Gibt es keinen Parser oder ähnliches, der das für mich erledigt?
|
AW: Escape sequenzen ersetzen
Vielleicht denke ich zu simpel, aber wieso nicht StringReplace? Das ist vielleicht nicht die schnellste Möglichkeit, aber wenn der Ausgangsstring nicht allzu lang ist, sollte das doch kein Problem sein.
|
AW: Escape sequenzen ersetzen
Wie wäre es wenn du den Parser schreiben würdest :mrgreen:
Ich würde das mit einem endlichen Zustandsautomaten angehen:
Delphi-Quellcode:
Nicht getestet, aber das Prinzip sollte klar werden.
function unescape(const input: AnsiString): AnsiString;
var state: (stNormal, stExpectX, stHex1, stHex2); curLength, cur: integer; escaped: string[3]; procedure normal; inline; begin state := stNormal; inc(curLength); result[curLength] := input[cur]; end; begin setLength(result, length(input)); curLength := 0; state := stNormal; for cur := 1 to length(input) do begin case state of stNormal: if input[cur] <> '\' then normal else state := stExpectX; stExpectX: if input[cur] = 'x' then state := stHex1 else normal; stHex1: if input[cur] in ['0'..'9', 'a'..'f', 'A'..'F'] then begin escaped := '$' + input[cur]; state := stHex2; end else normal; stHex2: begin if input[cur] in ['0'..'9', 'a'..'f', 'A'..'F'] then escaped := escaped + input[cur] else state := stNormal; inc(curLength); result[curLength] := Chr(StrToInt(escaped)); if state = stNormal then normal else state := stNormal; end; end; end; setLength(result, curLength); end; |
AW: Escape sequenzen ersetzen
Zuerst müssen doch einmal die genauen Kodierungsregeln bekannt sein. Wie wird denn z.B.diese Original-Zeichenkette kodiert?
Code:
Bei der Rückgewinnung sollte dann doch nicht herauskommen:
'äöü' wird als '\xe4\xf6\xfc' codiert!
Code:
'äöü' wird als 'äöü' codiert!
|
AW: Escape sequenzen ersetzen
Zitat:
Wenn das Prinzip klar ist, kann man aus stExpectX ein stExcpectModifier (oder so) machen und '\n', '\0' und andere ähnlich behandeln. EDIT: Ich habe den Code mal getestet und verbessert. Wer mit Lazarus testet, sollte die Ausgabe besser mit AnsiToUtf8 behandeln. |
AW: Escape sequenzen ersetzen
Ich kram das hier mal aus der Versenkung, weil das fast auf mein Gegenwärtiges Problem zutrifft: Datenquelle ist ein Python YAML. Ich erhalte escapete Unicodestrings wie zum Beispiel 'Gl\xF6ckner' an Stelle von 'Glöckner'. YAML ist nix anderes als hübscheres JSON (überspitzt gesagt, ich nutze YAML eigentlich nur, weil es einen Datumstypen kennt, was unter Python ein Segen ist, da kennt JSON nämlich [Standardkonform] keinen). Zurück zu meinem Problem: Was hier geschildert wurde ist ein Eigenbau, den ich von einem "Web" und "IoT" affinen Konstrukt wie Delphi in der Reinkarnation Seattle als eingebaut angesehen hätte. Ich finde aber nicht wirklich etwas hilfreiches. Es gibt Vorschläge TJSONObject.ParseJSONValue zu verwenden. Das scheitert daran, daß mein YAML eben kein JSON ist, denke ich. Zumindest bleibt das JSON Objekt leer, nach dem Parsen des Strings.
Edith fand heraus, daß ParseJSONValue daran scheitert, daß \x nicht vorgesehen ist sondern nur \u... Sherlock |
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:09 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz