![]() |
CSV-Datei mit /sb
Habe eine csv-Datei von einem Kunden erhalten, wo ein hin und wieder vorkommendes "/sb" im Text (in dem freien Info-Feld) dazu führt, dass -per Stringlist.loadfromfile - an dieser Stelle ein Zeilenumbruch stattfindet.
Wenn ich die Datei in Notepad.exe öffne, findet der Umbruch nicht statt, die Datei hat 21609 Datensätze, mit Delphi Stringlist geöffnet sind es aber 27704 Datensätze. Hat jemand eine Ahnung, warum das so ist und wie man es hinbekommt, dass auch die Stringlist nur 21609 Zeilen generiert? |
AW: CSV-Datei mit /sb
Kannst du mal eine Beispieldatei und etwas Code zeigen, mit dem man das nachstellen kann?
|
AW: CSV-Datei mit /sb
Hilft das eventuell? :
![]() |
AW: CSV-Datei mit /sb
"/sb" kommt vermutlich 27704 - 21609 = 6095 mal im Text vor?
|
AW: CSV-Datei mit /sb
OK, habe da mal genauer mit einem Hex-Editor reingesehen. Nach /sb folgt "0A" (oder asci #10), was ja einen zeilenvorschub repräsentiert.
Die Stringlist macht nach dem einlesen (Stringlist.loadfromfile) aber da ein #13#10 draus. /sb könnte ja für "soft break" stehen oder so. Ist mir jedenfalls noch nicht untergekommen. Mein Problem kann ich erst mal lösen, indem ich nach dem Einlesen der Datei z.B.
Delphi-Quellcode:
stringlist.text := ReplaceStr (stringlist.text, '/sb' + #13#10, ' ');
aufrufe, um die richtige Zeilenzahl zu bekommen. (tatsächlich werde ich es nicht durch ein Leerzeichen ersetzen, sondern durch ein anderes Sonderzeichen, dass in meinen mehrzeiligen Feldern (Memo) den Zeilenumbruch repräsentiert). Interessant finde ich aber, dass Windows Notepad so eine Zeile als eine Zeile einliest... Nachtrag: Windows-Notepad ignoriert einfach #10 Zeichen und macht keinen neue Zeile auf, auch ohne /sb Soweit ich das jetzt raus gefunden habe, wird in diesem Feld, das mehrzeiligen Text repräsentiert, das erste #10-Zeichen mit /sb eingeleitet, es können aber noch weitere #10 Zeichen (ohne /sb Einleitung) innerhalb des Textes für dieses Feld vorkommen. Kann das irgendein Standard sein? Sehe ich jedenfalls zum ersten mal. Suchen und ersetzen reicht da nicht, da muss ich das wohl als Memorystream einlesen und jedes einzelne #10 Zeichen, das nicht im Verbund mit #13#10 steht, eliminieren (bzw. durch mein eigenes Kennzeichen ersetzen).... |
AW: CSV-Datei mit /sb
Zitat:
Und da für #10 im Font nichts hinterlegt ist, hat das in der Anzeige eine Breite von 0, was du nur bemerkst, wenn du mit den Cursortasten zeichenweise durch den Text gehst. |
AW: CSV-Datei mit /sb
Wenn man mit csv-Dateien hantiert, ist "Zeile" ein untauglicher Begriff. en Datensatz wird durch x0D0A (#13#10) begrenzt, es sei denn diese Zeichenkombination befindet sich zwischen zwei " dann handelt es sich um ein (text)Feld das einen mehrzeiligen Text enthält.
Eine csv-Datei mit dem Notepad zu öffnen oder sie in eine Stringliste einzulesen, ist nicht in jedem fall zuverlässig und eignet sich allenfalls, um einen Überblick zu erhalten. Gruß K-H U.U. kann man auch andere Vereinbarungen bezgl. der Feld und Satz-seperatoren treffen, aber das ist Vereinbarungssache. |
AW: CSV-Datei mit /sb
NotePad++ ist die bessere Lösung zur Fehlersuche in solchen Dateien. Da kann man sich die "Steuerzeichen" anzeigen lassen und sieht eigentlich sehr schnell was los ist.
Sherlock |
AW: CSV-Datei mit /sb
Was alles unter ".csv" so kursiert ist zwar nicht ganz zufällig, aber oft ist es nicht mal das Comma, aus Comma-Separated-Values, was man als Trenner findet.
[quote].. As indicated by carriage return or linefeed characters, each line in the file is then appended in the list as a string. ..[quote] ![]() Auch da kann man sich über die Formulierung streiten, aber es wird jedenfalls beschrieben, das 2 verschiedene Zeichen als Delimiter des Zeilenendes akzeptiert werden. Die Funktion tut also erstmal, was sie soll, oder? |
AW: CSV-Datei mit /sb
Das ist hardcoded in
Delphi-Quellcode:
.
TStrings.SetTextStr
Delphi-Quellcode:
while not (P^ in [#0, #10, #13]) do Inc(P);
Da die Methode aber virtuell ist, könntest du die überschreiben und durch einen für diesen Fall passenden Code ersetzen. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 11:03 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz