![]() |
Delphi-Version: 11 Alexandria
TStringList verhält sich in D11 anders mit enthaltenen #0
Habe eben einen unschönen Bug (oder Absicht?) in der TSrtingList, genauer in TString.SetTextStr, gefunden, den es in 10.3 noch nicht gab. Im konkreten Fall lade ich ein HTML-Template in eine TStringList (TPageProducer.HTMLDoc.LoadFormFile(..)). Nun hat sich hier ein Template eingeschlichen das anscheinend seit Jaharen ein #0 Char ehthalten hat. Diese war bisher keien Problem, da die StringList solche #0 (und #13#10) bisher überlesen hat.
Das Problem ist nun, dass enthaltene #0 Character in D11 nicht mehr herausgefiltert werden, sondern im SL.Text enthalten bleiben. Das hat nun den Nebeneffekt das der TPageProducer.Content nicht mehr das ganze Template verabeitet und alles nach dem #0 fehlt. Das #0 ist für den Parser im TPageProducer eine Fileende. Mich würde nun interessieren, wieso TString.SetTextStr komplett umgeschrieben wurde und die #0 Zeichen nicht mehr behandelt. Ist das Absicht oder eine Bug? Code aus D10.3:
Delphi-Quellcode:
Code aus D11.1:
procedure TStrings.SetTextStr(const Value: string);
var P, Start, LB: PChar; S: string; LineBreakLen: Integer; begin BeginUpdate; try Clear; P := Pointer(Value); if P <> nil then if CompareStr(LineBreak, sLineBreak) = 0 then begin // This is a lot faster than using StrPos/AnsiStrPos when // LineBreak is the default (#13#10) while P^ <> #0 do begin Start := P; while not (P^ in [#0, #10, #13]) do Inc(P); SetString(S, Start, P - Start); Add(S); if P^ = #13 then Inc(P); if P^ = #10 then Inc(P); end; end else begin LineBreakLen := Length(LineBreak); while P^ <> #0 do begin Start := P; LB := AnsiStrPos(P, PChar(LineBreak)); while (P^ <> #0) and (P <> LB) do Inc(P); SetString(S, Start, P - Start); Add(S); if P = LB then Inc(P, LineBreakLen); end; end; finally EndUpdate; end; end;
Delphi-Quellcode:
procedure TStrings.SetTextStr(const Value: string);
var P, PCurVal, PCurLB, PStartVal, PEndVal, PStartLB, PEndLB: PChar; S: string; LineBreakLen: Integer; begin BeginUpdate; try Clear; P := Pointer(Value); if P = nil then Exit; LineBreakLen := Length(LineBreak); if LineBreakLen = 0 then begin Add(Value); Exit; end; PEndVal := P + Length(Value); // When LineBreak is: // * sLineBreak - for compatibility with Windows, Posix and old macOS platforms, // we handle #13#10, #10 and #13 as it would be #13#10. // * NOT sLineBreak - we use strict checking for LineBreak. if CompareStr(LineBreak, sLineBreak) = 0 then begin while P < PEndVal do begin PStartVal := P; while (P < PEndVal) and not (P^ in [#10, #13]) do Inc(P); SetString(S, PStartVal, P - PStartVal); Add(S); if P^ = #13 then Inc(P); if P^ = #10 then Inc(P); end; Exit; end; PStartLB := Pointer(LineBreak); PEndLB := PStartLB + LineBreakLen; PCurLB := PStartLB; PStartVal := P; while P < PEndVal do begin while (P < PEndVal) and (P^ <> PStartLB^) do Inc(P); if P < PEndVal then begin PCurVal := P + 1; Inc(PCurLB); while (PCurLB < PEndLB) and (PCurVal < PEndVal) and (PCurVal^ = PCurLB^) do begin Inc(PCurVal); Inc(PCurLB) end; if PCurLB = PEndLB then begin SetString(S, PStartVal, P - PStartVal); Add(S); P := PCurVal; PStartVal := P; end else Inc(P); PCurLB := PStartLB; end; end; if P > PStartVal then begin SetString(S, PStartVal, P - PStartVal); Add(S); end; finally EndUpdate; end; end; |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Ein #0 in einem String ist nunmal ein Wert der Probleme produziert.
Filtere ihn davor raus und gut ist. Du hast eher Glück gehabt das solche fehlerhaften Daten überhaupt so lange kein Probleme verursacht haben und du nicht schon bei anderen Funktionen/Methodenaufrufen an das Problem gestoßen bist das #0 in der C/WinAPI-Welt ein Kennzeichner für eine Stringende ist. |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Zitat:
![]() Insbesondere wird hier wohl das vorige Verhalten als ungewollt betrachtet. Da es nicht dokumentiert ist, kann die Implementierung auch entsprechend angepasst werden. Ich fürchte, du wirst dir deinen eigenen #0-Bereiniger davor schalten müssen. Das würde auch die bisher verborgene Intention klarer machen. Offenbar rechnen die meisten Entwickler nicht damit, dass eine TStringList #0-Zeichen ausfiltert. Unabhängig davon kenne ich aber auch Fälle, in denen #0-Zeichen in Strings als Separatoren zu weiteren Informationen missbraucht werden, nur um eine korrekte Datenstruktur (z.B. Array, Record) zu vermeiden. Dann wird der erste Part einfach über PChar(S) ausgelesen. Bei den folgenden wird es dann halt komplexer. Sowas kommt meistens durch irgendwelche Quick'n'Dirty Erweiterungen rein und sollte schleunigst refactored werden. Konkret für deinen Fall würde ich eine Art StripZeroChars Funktion empfehlen. Dann ist das Problem ein für alle Mal gebannt. |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Grundsätzlicher Bug?
Warum wird SL.LineBreak beim Einlesen überhaupt "so" verwendet? Wenn LineBreak irgendwass mit #13 und/oder #10 ist, dann gehören ALLE Arten von Linebreaks richtig behandelt, also egal ob #10, #13#10 oder #13. Nur wenn LineBreak irgendwas ANDERES ist, dann explizit das zum Tennen suchen. Ja, man könnte auch auch "Q" oder "," als LineBreak verwenden, aber eigentlich gehört sowas gefälligst ins DelimitedText. Ob man nun auch #0 als Linebreak interpretiert oder zum kompletten Leseabbruch benutzt, daüber lässt sich streiten. IMHO hat per se #0 in einem Delphi-Strings keine Bedeutung und sollte somit auch als normaler "Char" behandelt werden. |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Zitat:
Delphi-Quellcode:
. Im Gegensatz zu vorher, wo die #0-Zeichen einfach entfernt wurden. Das alte Verhalten war also streng genommen nicht Delphi-konform, die Änderung also nachvollziehbar.
TString.SetTextStr
|
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Achso ... andersrum verstanden.
Joar, aber ging vorher oft auch nicht anders, da an zuvielen Stellen intern mit PChar gearbeitet wird, was bei #0 aufhört. (wobei das PChar per se kein Problem ist, aber falsche PChar-Funktionen zu verwenden schon, wo es andere PChar-Funktionen gäbe, welche dennoch mit einem Length-Parameter arbeiten) Gaaaaanz früher gab es auch mal ein Datei-Ende-Zeichen (85 oder so ... weiß nicht mehr ob Hex oder Dez), bei welchem TP/Delphi auch gern aufhörte die StringList einzulesen. :stupid: |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Ich habe halt gestern den ganzen Arbeitstag gebraucht herauszufinden was da auf eineam in D11 falsch läuft und ein HTML-Template nun auf einmal nicht mehr richtig verarbeitet wird. Irgendwann habe ich per Zufall entdeckt, dass da an der Stelle wo es aufhört eine #0 drin ist.
Ich bin ja auch eher der Meinung, dass es bisher falsch war und #0 eigentlich nicht entfernt werden sollten. Von daher kann ich mit der Änderung leben. Was mir halt nicht so recht gefällt ist, das ich nun einen Check für #0 machen muss und das eigentlich unnötig Zeit kostet, für einen äusserst seltenen Spezialfall. Der eingentliche Fehler liegt ja hier nicht in Delphi sondern im HTML-Template. Vermutlich lasse ich das auch weg und das Tempalte muss dann halt korrigiert werden. |
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Zitat:
|
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Was ich mich auch frage ist, wieso man auf die Idee kommt, in den Code einer HTML-Seite Null-Chars einzubauen. Ich wüsste nicht mal jetzt auf Anhieb, ob alle Browser das überhaupt vernünftig darstellen würden/könnten und was dafür die W3-konforme Darstellung wäre. Gerade bei einem Browser, der nun einmal nicht in Pascal, C# oder Java geschrieben wurde.
|
AW: TStringList verhält sich in D11 anders mit enthaltenen #0
Das macht ja auch keiner mit Absicht, dennoch hat sich hier in einem HTML Template ein NUL Char eingenistet. Woher und wieso wissen wir leider nicht, nur soviel, dass der Code von irgendwoher vom Kunden per Copy/Paste eingefügt wurde. Das Zeichen hat den Browser bisher garnie erreicht, weil das schon vorher durch die Stringlist eliminiert wurde. Neu würde es ankommen, aber auch hier gibt es noch weiterren Code im Webbroker Framework, das dann eben abbricht und den Rest danach nicht mehr liefert. Die Möglichkeit ein NUL mit dem Webbroker FW an den Browser zu senden, war/ist also garnicht möglich.
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:57 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz