![]() |
Delphi und 64-Bit Programme
Bei einem aktuellen Thread zum importieren von großen XML-Dateien habe ich mich gewundert, dass das Lesen einer 1,6 GB großen Datei nicht möglich sein sollte (also zumindest unter 64 Bit).
Habe dann mal spaßeshalber unter Windows als 64-bit-Programm versucht eine ca. 2 GB csv-Textdatei in eine Stringlist zu laden (die "star2002-full.csv" Datei von dieser Quelle: ![]() Tja und wenn man sieht, dass dort - und an vielen anderen Stellen in der System.classes Hilfsvariablen mit dem Typ Integer deklariert sind, wird schnell klar, das kann nicht funktionieren, wenn der Inhalt oder der Wert einer Variablen größer als 2GB ist. In der System.classes (aber auch System.Generics.collections) sind in vielen Klassen Schleifenvariablen, Enumeratoren, Rückgabewerte oder Parameter als Integer definiert. Letztlich funktionieren alle solche Klassen nicht, wenn ein Index > 2GB ist. Ist das heutzutage noch zeitgemäß? Wo manche Rechner inzwischen 64 GB oder mehr Arbeitsspeicher haben? Müsste nicht zumindest für die 64-Bit-Plattform hier Int64 an allen diesen Stellen verwendet werden? Ich kann mir allerdings auch vorstellen, dass das dann ein ziemlicher (Um-) Bruch wäre und zu vielen Seiteneffekten bei bestehenden Programmen führen würde. Was meint Ihr? |
AW: Delphi und 64-Bit Programme
Natürlich wäre es besser int64 einzusetzen und durch bedingte Compilierung auch halbwegs kompatibel zu halten. Aber auch bei < 64 bit ist es aus meiner Sicht fatal, Integer einzusetzen statt Cardinal. Das war nötig weil der Index bei Listenfunktionen durch Rückgabe von -1 als "Fehlercode" missbraucht wird. Durch diese allgemein verbreitete Unsitte wird ja auch bereits die Hälfte des Wertebereichs verschenkt.
|
AW: Delphi und 64-Bit Programme
Ein Int32 mit Vorzeichen geht im positiven Zahlenbereich bummelig bis 2 Milliarden.
Möglicherweise war man der Ansicht, dass eine StringList für derartige und noch größere Datenmengen schlicht der falsche Container ist. 64 Bit hin oder her. Die Stream-Klassen beispielsweise kommen mit entsprechenden Größenordnungen zurecht. |
AW: Delphi und 64-Bit Programme
Zitat:
Man kann in eine Stringliste aber prinzipiell auch problemlos mehr Daten laden, wenn man das Problem der Stringlänge beim Laden umgeht:
Delphi-Quellcode:
Das ist jetzt nur schnell hingeschludert und funktioniert nicht für alle Zeilenumbrüche.
type
TMyStringList = class(TStringList) private FNoClear: Boolean; public procedure Clear; override; procedure LoadFromStream(Stream: TStream; Encoding: TEncoding); override; end; { TMyStringList } procedure TMyStringList.Clear; begin if not FNoClear then inherited; end; procedure TMyStringList.LoadFromStream(Stream: TStream; Encoding: TEncoding); var Size, LengthToLastLineBreak: Integer; Buffer: TBytes; begin BeginUpdate; try FNoClear := True; while True do begin Size := Min(Stream.Size - Stream.Position, 1073741814); if Size = 0 then break; SetLength(Buffer, Size); Stream.Read(Buffer, 0, Size); Size := TEncoding.GetBufferEncoding(Buffer, Encoding, DefaultEncoding); SetEncoding(Encoding); // Keep Encoding in case the stream is saved LengthToLastLineBreak := Length(Buffer); while (LengthToLastLineBreak > 0) and (Buffer[LengthToLastLineBreak - 1] <> 10) do Dec(LengthToLastLineBreak); Stream.Seek(LengthToLastLineBreak - Length(Buffer), TSeekOrigin.soCurrent); SetTextStr(Encoding.GetString(Buffer, Size, LengthToLastLineBreak - Size)); end; finally FNoClear := False; EndUpdate; end; end; |
AW: Delphi und 64-Bit Programme
Danke für Euer Feedback.
Es ging mir jetzt nicht speziell um dieses StringList-Demo. Wie man die zitierte 2GB großte Text-Datei (mit 17,5 Mio Zeilen) trotzdem in eine Stringlist laden kann, weiß ich (Daniel hat es schon angedeutet, mit Hilfe eines Streamreaders)). Es ging mir um die generelle Frage, ob man die Klassen (z.B. mit Überladungen) auf 64-Bit Nutzung umstellen bzw. erweitern sollte. Könnte mir vorstellen, z.B. bei größeren Simulationen, wo z.B. 5 Mrd. Werte wegen der Echtzeit-Anforderung im Arbeitsspeicher gehalten müssen, es u.U. doch in irgendeinem Zusammenhang auch hilfreich sein könnte, ein TDictionary zu verwenden. Aber auch das könnte ich nicht verwenden, da dort in der Klasse z.B. "FCount" und alle anderen relevanten Zahlenwerte Integer sind. Mir ist schon klar, dass ist hier eine Diskussion von untergeordneter Relevanz und nichts was jetzt in Delphi vorrangig behandelt werden müsste (wenn überhaupt). Mich hat es nur interessiert, ob irgendjemand hier auch schon mal an ähnliche Grenzen in Umgang mit sehr großen Datenmengen in Zusammenhang mit 32/64 Bit Implementierung der Standard-Delphi Klassen gestoßen ist und irgendwo Erweiterungsbedarf gesehen hätte. |
AW: Delphi und 64-Bit Programme
Sicher wäre es wünschenswert, wenn es weniger Grenzen geben würde. Allerdings sollte man dabei auch nicht vergessen, dass die vorhandenen Klassen für so große Datenmengen, wie Daniel auch schon angedeutet hat, schlicht nicht ausgelegt sind.
Es wäre daher sinnvoller für diesen Zweck nicht die vorhandenen Klassen zu erweitern, sondern komplett neue zu entwickeln, die intelligenter mit solchen Datenmengen umgehen. Zum Beispiel wäre es sinnvoll, wenn man mit mehreren Threads arbeiten könnte, um so die Lade- und Zugriffszeiten zu verkleinern. Dafür wären aber ganz andere Ansätze erforderlich als sie aktuell in Delphi implementiert sind. In anderen Systemen gibt es dafür ja auch schon einiges. |
AW: Delphi und 64-Bit Programme
Da kann ich nur zustimmen. Schön wär's, wenn die alten Verfahren nur mit größeren Typen kompiliert werden müssten. Aber das ist nur ein Traum.
Dann also lieber neu, mit besseren Strategien. Es gibt (jenseits von XML) Datenformate, die extra für Streaming leicht verändert werden bzw. speziell für Streaming empfohlene Verfahren. Hab mal zum Spaß 2GB XML in VS Code geöffnet. Ich hätte es ihm zugetraut, aber auch nach diversen Warnungen "starte mich neu mit 4GB Speicherreservierung" war da nichts zu machen. Was VS Code ganz nett macht, es schaltet mit einem Hinweis das Parsing bei großen Dateien ab, deswegen war ich auf die Idee gekommen, das einfach mal doof auszuprobieren. Anderswo wird also auch nur mit Wasser gekocht. |
AW: Delphi und 64-Bit Programme
Für große Textdateien, natürlich auch für große XML-Dateien, würde ich Notepad++ (kann in der neuesten Version 8.3 mit Dateien > 2GB umgehen) oder PilotEdit (kann in der professionellen Variante bis zu 400GB große Dateien editieren) empfehlen. Beide Programme arbeiten offensichtlich mit Streaming, halten also nur eine bestimmte Teilmenge des Textes im Hauptspeicher.
Für große Datenfelder, wie gelegentlich bei Simulationsrechnungen notwendig, würde ich ebenfalls mit Streams oder einer Aufteilung eines Feldes von z.B. 5Mrd Double-Werten in mehrere Teilfelder arbeiten. Der Index im Stream ist bei Delphi die Position-Eigenschaft und die ist Int64. |
AW: Delphi und 64-Bit Programme
Hallo,
hier widerspreche ich mal Daniel. Einer der oft propagierten Vorteile von 64Bit ist ja gerade der Zugriff auf mehr als 2 (?), 4 GB Speicher. Hier müsste Embarcadero auch bei StringList nacharbeiten. Andere mit 64Bit erzeugten Programme können das ja auch. Wobei man ja nicht weiß, wie viel RAM ein Anwender wirklich in seinem Rechner hat. Oft wird ja Chunking benutzt, also das Aufteilen der Datei in einzelne Bereiche. Unter 64Bit könnten größere Bereiche oder mehr Bereiche geladen werden, in Abhängigkeit des tatsächlichen Speichers. Ich hatte mal unter 32Bit mit StringList's in einer StringList gearbeitet, dass klappte sogar ... |
AW: Delphi und 64-Bit Programme
Gibt es nicht ganz genau dafür den Typ
![]() Zitat:
Delphi-Quellcode:
.
NativeInt
Ist ja in anderen Sprachen genauso (size_t in C++, isize/usize in Rust, ...). |
AW: Delphi und 64-Bit Programme
Zitat:
Wenn man geeignete Klassen wie eben einen Stream verwendet, kann man ja auch in Delphi problemlos mehrere GiB in den Speicher schaufeln. |
AW: Delphi und 64-Bit Programme
Ich dachte das Integer der generische Typ ist und automatisch zu Int64 wird, wenn man auf 64Bit als Zielpattform übersetzt.
Früher war das jedenfalls mal so das aus 16 Bit Integer 32 Bit wurden beim Umstieg auf ein neueres Delphi (incl schöner Probleme beim lesen von Binärdateien, bei denen man keinen Gedanke auf das Anpassen des Loaders verschwendet hatte) |
AW: Delphi und 64-Bit Programme
Das war wohl so beim Wechsel von Delphi 1 zu Delphi 2.
Integer bleibt aber tatsächlich bei 4 Byte. Wenn es automatisch gehen soll, dann brauchst NativeInt bzw. NativeUInt. |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
![]() LongInt entspricht bei 32-Bit und bei 64-Bit Windows einem 32-Bit Wert, bei 64-bit POSIX (incl. iOS und Linux) aber einem 64-Bit Wert. Wie Sebastian schon sagte, hat man sich da an den entsprechenden Vorgaben seitens Intel und Microsoft orientiert. In C# ist ein int halt immer ein 32-Bit Wert - in Objective C aber nicht. |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Hallo,
und ich bleibe dabei. Ein TStringList sollte unter 64Bit mehr Daten verwalten können als unter 32Bit. Auch Embarcadero bringt ja immer das "alter Code läuft wie bisher". Ja, aber mit 64Bit muss auch der komplette 64Bit-Speicherbereich ausgenutzt werden! Punkt!!! Und jetzt macht mich rot ;) |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
Jetzt ist es was? ...und in Zukunft? Wollen wir ehwig gestrig bleiben? Rostig? Alt? Der Typ String ist noch immer ein reserviertes Wort im Quelltext, also Compilermagic. Dass man die realen String Typen vieleicht besser um eine 64Bit Variante erweitert, sollte klar sein. Aber String ist jetzt schon dynamisch das was man eingestellt hat. Warum dann unter 64Bit nicht auch 64Bit tauglich? Dass man beim übersetzen in 64Bit den Kopf angeschaltet lassen muss sollte jedem klar sein. Bestimmte Sachen, wie einen String in eine Binärdatei schreiben oder daraus lesen ohne eine Wrapper zu verwenden der sich um 32Bit / 64Bit unterschiede kümmert ist dann halt als Dummheit zu verbuchen. |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
Übrigens ist WideString auch keine Alternative (eigentlich sogar ein Rückschritt), da das interne Datenformat auch hier 4 Bytes für die Länge reserviert - dummerweise diesmal in Bytes, so dass ein WideString nur halb so lang werden darf wie ein string. |
AW: Delphi und 64-Bit Programme
Hmm. Egal, ob ich Code für 64 Bit oder 32 Bit kompiliere, ich gehe davon aus, dass der Code - nur für sich genommen - funktioniert. Schnittstellen, Dateien etc sind außen vor, das ist bei UniCode ja auch so. Dass ich mir beim Compilieren für 64 Bit überlegen muss, ob mein Code per se funktioniert, ist nicht so toll. Woher weiß ich denn, was in der RTL nicht funktionieren würde?
|
AW: Delphi und 64-Bit Programme
Zitat:
Zitat:
|
AW: Delphi und 64-Bit Programme
Braucht man wirklich Strings mit Int64 Länge? Was soll das bringen.
Für grosse Daten gibts ja MemoryStreams - die haben auch nicht das Problem, dass zwischen irgendwelchen codepages hin und her gewandelt wird. Viele moderne Speicherformate verwenden nur 8 Bit, also RTF, XML, HTML ... da strings mit seinen WideChar zeichen auch nicht aussreicht alle Zeichen zu codieren. Die Speicherung solcher Daten in einen "string" fürhrt dann regelmässig zu 00nn00nn00nn00nn. Dass ein Integer 32 bit hat, auch unter 64 bit war meiner Ansicht nach die genau richtige Entscheidung, da der Entwickler so explizit die Möglichkeit hat zu entscheiden, ob der große Typ erforderlich ist, oder nicht und "alte" Programme 1:1 laufen. Wichtig ist es aber IntPtr zu verwenden für alle Integer die auch Speicheradressen sein können- typischerweise für die Übergabe an SendMessage u.ä. |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
Man stelle sich nur mal vor, man würde eine 32GB Textdatei in einen solchen 64-Bit String einlesen. Ist die Datei UTF-8 codiert, kommen da ca. 64GB Speicherverbrauch zusammen. Da käme so manches handelsübliche Notebook schon an seine RAM-Grenzen und müsste Speicher auslagern, der dann später wieder eingelesen werden muss. Effizient geht anders. Ich wäre als wirklich an konkreten Beispielen interessiert, wo Strings mit mehr als 2^30 Zeichen notwendig oder hilfreich (bequemer zählt nicht) wären. |
AW: Delphi und 64-Bit Programme
Zitat:
Allerdings ging es garnicht um String sondern um TStrings (
Delphi-Quellcode:
).
System.Classes.TStrings
Zitat:
Delphi-Quellcode:
zu laden.
TStrings
Also ein Zeilenweises array of String. Das sollte doch gehen? Interessant ist die Frage, was passiert bei den Properties CommaText und Text, denn die sind
Delphi-Quellcode:
.
String
|
AW: Delphi und 64-Bit Programme
Zitat:
Aber mit TFileStream usw. gibt es ja sinnvolle Möglichkeiten für große Dateien. |
AW: Delphi und 64-Bit Programme
Zitat:
Zitat:
Aber wie Sebastian schon schreibt, spricht ja auch nichts dagegen eine Ableitung von TStringList zu schreiben, bei der die LoadFromStream/SaveToStream Implementierungen eben nicht über SetTextStr/GetTextStr laufen. Dann könnte man diese ja auch für größere Dateien verwenden. Als Nebeneffekt würde auch der interne Buffer für das Encoding wegfallen. Da liegt nämlich auch noch ein Speicherfresser: Erst wird ein Buffer angelegt, der den kompletten Inhalt der Datei in den Speicher lädt. Dann wird daraus anhand des Encodings ein String gemacht, bevor dieser dann zeilenweise zerlegt in die interne Liste wandert. Das braucht dann temporär mal eben so etwa 5x soviel Speicher wie die Datei groß ist (danach dann 2x). Wie man dann allerdings halbwegs performant mit so einer Monster-Stringliste umgehen soll steht auf einem anderen Blatt. |
AW: Delphi und 64-Bit Programme
Wer ne 32GB Datei in eine TStringList läd, hat ganz andere Probleme als den Fakt, dass es bei mehr als (2^31)-1 Zeilen kracht.
Zitat:
Wer sich mal die Mühe gemacht hat, in den Code von TStringList zu schauen, der wird gesehen haben, dass pro Eintrag 8 bzw 16 byte benötigt werden (TStringItemList). D.h. dass selbst beim Eintragen von Leerstrings in eine TStringList bei einer non LAA Anwendung gerade mal Speicher für ca 268mio Einträge zur Verfügung steht. Anders herum betrachtet heißt das, dass eine TStringList mit einer Capacity von MaxInt als 64bit Anwendung schon allein ca 32GB verbrauchen würde (MaxInt*16)! Und da sind noch gar keine Strings drin. Mal kurz durchgerechnet, welche Mindestzeilenlänge die Datei haben müsste, wenn sie in UTF8 kodiert wäre und nur ASCII Chars enthalten würde - das wären 32GB Zeichen. Eine TStringList hat maximal Platz für 2^31-1 Einträge. Somit müssten die Zeilen im Durchschnitt 16 Zeichen lang sein, das kommt mir doch schon sehr kurz vor für eine Datei, die man mit einer TStringList verarbeiten möchte. Ich stand kürzlich selbst vor der Entscheidung, ob ich bei den Spring Collections auf NativeInt für Index umstellen soll oder nicht, aber da kommt man dann doch auf ganz andere Probleme, wie den Fakt, dass ein open Array auch unter 64bit seinen versteckten High Parameter nur als Int32 übergibt. P.S. Ist auch schon eine ganze Weile lang "bekannt" (vermutlich inzwischen schon wieder vergessen worden, ist halt nicht einfach bei zig Tausend Issues in nem JIRA den Überblick zu behalten, woll) ![]() |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
Zitat:
Zitat:
Trotzdem gibt es Fälle in der Bildverarbeitung wo es mal eng werden kann. Erst recht mit 32Bit Programmen. Daher lebt mein einziges 64Bit Programm unter Lazarus, da geht 64Bit schon ein bisschen länger und nicht erst seit die CE das auch erlaubt. |
AW: Delphi und 64-Bit Programme
Zitat:
Delphi-Quellcode:
procedure Foo(const values: array of Integer);
begin Writeln(High(values)); end; begin Foo([]); end. |
AW: Delphi und 64-Bit Programme
Zitat:
|
AW: Delphi und 64-Bit Programme
So ging es mir auch, ja. Ich hatte ja schon einen Blick riskiert...
|
AW: Delphi und 64-Bit Programme
TStrings.LoadFromStream stört mich auch, weil dies beim Entpacken von ZIP-Dateien schon mal blöd ist.
Aber bei großen Dateien wird wahrscheinlich eh das folgende performanter sein (im ms (MemoryStream) liegt eine entpackte ZIP-Datei), weil ich theoretisch auch stückweise mit dem Ergebnis arbeiten kann:
Code:
Result:=TStringList.Create(true);
Result.BeginUpdate; reader:=TStreamReader.Create(ms); while (not reader.EndOfStream) do Result.Add(reader.ReadLine()); Result.EndUpdate; Reader.Free; end; |
Alle Zeitangaben in WEZ +1. Es ist jetzt 21:59 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz