![]() |
Eine sehr große textbasierte Datei durchsuchen?
Hallo Delphianer,
mein erstes Thema und ich habe folgende Frage. Aber vorher kurz zu mir: Delphi hatte ich mal vor vielen Jahren in der Schule, seit dem habe ich mit Delphi kaum was gemacht. Und nun zu meiner Frage: Ich möchte eine sehr große textbasierte Datei durchsuchen, nämlich eine GEDCOM-Datei ( ![]() Gruß Johann |
AW: Eine sehr große textbasierte Datei durchsuchen?
Hi,
als ersten Schritt würde ich mir mal ![]() ![]() |
AW: Eine sehr große textbasierte Datei durchsuchen?
Lade die Datei in ein
![]() Sherlock |
AW: Eine sehr große textbasierte Datei durchsuchen?
OT:
1 GB große GEDCOM Datei? Wieviele Personen sind denn darin? :shock: |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Ist das ein Textbackup der Datenbank von FamilySearch?
Ein einzelner Mensch kann ja unmöglich soviele Daten zusammentragen. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Die alten Dateifunktionen ala
![]() Also falls dir "schnell" egal ist und es auch ruhig langsamer und einfach sein darf. Es gibt hier auch mehrere Komponenten zu finden, welche die Datei stückchenweise in den Speicher laden können. [DP]große Textdateien[/DP] |
AW: Eine sehr große textbasierte Datei durchsuchen?
Ja, es geht nur ums Lesen, mehr nicht. Ok, ich schaue mal was sich besser umsetzen lässt, TFileStream oder ReadLn. Und vielen Dank erst mal!
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Ich kenne bspw. die Ahnengemeinschaft aus Sachsen, aber die haben nur 179013 Personen im Stammbaum und es arbeiten 476 Menschen daran mit. ![]() |
AW: Eine sehr große textbasierte Datei durchsuchen?
Siehe PN.
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Schneller als das hier geht bestimmt aber es ist allemal schneller als alles was man sich selber baut
![]() |
AW: Eine sehr große textbasierte Datei durchsuchen?
Ich würde da jetzt keinen Gedanken an Text-Dateien verschwenden, sondern gleich eine Datenbank nutzen.
spätestens bei der dritten Suchanforderung ist die im Vorteil. Gruß K-H |
AW: Eine sehr große textbasierte Datei durchsuchen?
Was bedeutet "arbeiten und vor allem schnell" konkret?
Ist es die "aktuelle" GEDCOM Version? Gibt es irgendwo Beispieldaten? |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Die eigentliche Datei habe ich noch nicht, aber eine Test-Datei, die ich mir selber erstellt habe. Meine, aber auch die eigentliche die ich noch bekomme, sind in der 5.5.1 Version. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Gruß K-H |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Wenn der Inhalt sortiert ist, also in deinem Fall nach Namen, wenn du nach Namen suchen willst, dann kann man die Datei schon sehr schnell "überfliegen" und muß nicht alles lesen.
Man könnte sich vorher auch einen Index aufbauen, wo der Anfang jedes Datensatzes in einer Namensliste steht, um schnell zum gewünschten Datensatz springen zu können. Vorallem wenn man mehrmals nacheinander sucht und die Liste der zu suchenden Namen nicht vorrher bekannt ist und man die nicht einfach in einem Lesedurchgang gemeinsam suchen könnte. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Wenn es nur darum geht, das du für dich persönlich Informationen rausfischst, dann kannst du auch das kostenlose Notepad++ versuchen. Sehr mächtiger Editor.
EDIT: Vergiss es, ab 1 GB macht der auch die Grätsche und sagt, dass die Datei zu groß ist. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Wenn die Datei vorhanden ist, kennt man vllt. die Struktur, aber nicht den Inhalt. Der erschließt sich erst beim Lesen. Und irgendwie werde ich das Gefühl nicht los, daß es nicht darum geht einen Namen zu finden, sondern einen Datensatz, der an Hand eines Namens identifiziert wird. @begin.delphi Auch XML Dateien wollen gelesen werden, da gibt es kein umherspringen zwischen den Knoten ohne daß Daten gelesen werden. Das ist manchmal nicht offensichtlich aber es geht wirklich nicht ohne. Gruß K-H |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Ich würde auch sagen dass die Daten in eine Datenbank überführt werden sollten. Alles andere ist doch ein Heidenaufwand mit vermutlich unterirdischer Geschwindigkeit.
|
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Gut, ich meinte eigentlich nur die funktionalen Seite. Was sind die "Arbeits"Szenarien/Anforderungen? Einen(1) Namen suchen bedeutet idR in einer solchen Datei, dass man zunächst den ersten findet -wenn die Codierung stimmt. Und: Formatbedingt kommen solche Gemeinheiten dazu, das Werte in mehreren Zeilen verstreut stehen können, Steuerzeichen dazwischen. Das findet man ohne passende Algorithmen nie, wenn man die Rohdaten durchsucht. Wie auch immer, findet man was, dann kann man weitersuchen, (über)springen, ausschließen, anzeigen usw. Man kann auch alle Zeilen suchen, in denen dieser Name vorkommt oder hier vielleicht besser alle Zeilengruppen, wo er vorkommt. Schnell: Auch hier interessiert mich eher, was schnell wäre in Sekunden, nicht welche Technik. In einer 2 GB Logdatei Suche nach einem Wert der ziemlich am Ende steht dauert mit einem alten Ultraedit bei mir grad ca 30 Sekunden. Ein "gib mir alle Zeilen mit [einBestimmterWert]" hab ich noch nicht probiert, dauert vermutlich genauso lang, wenn es geht. Worauf ich hinaus will: Wenn Du nur 10 Namen suchen musst und dann fertig bist, nimm einfach einen geeigneten Editor. Wenn du mehr "musst", dann wäre es bei dem Volumen nicht verkehrt, die Anforderungen genauer zu kennen und dann eine geeignete Technik zu suchen. BTW Es gibt Opensource Software, die GEDCOM kann. Hast Du die schon probiert? Versagen sie den Dienst? P.S: Ich seh grad, das Thema Anforderungen und geeignete Technik ist eh schon im Gang. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Am Anfang einmal die Datei durchlaufen und in 'ner Liste das speichern (TStringList/TDictionary<>/...) Es kommt vorallem darauf an wie oft er in dieser Datei was sucht. Man kann den Inhalt auch in eine Datenbank schieben und dort weiterarbeiten. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
Gruß K-H |
AW: Eine sehr große textbasierte Datei durchsuchen?
Zitat:
![]() - zur Mitte - den Anfang des Blocks suchen - schauen ob passend oder größer/kleiner - wenn nicht passend, dann zur Mitte des Blocks davor oder dahinter usw. |
AW: Eine sehr große textbasierte Datei durchsuchen?
Die binäre Suche dürfte schwierig werden, man hat (selbst bei Sortierung) nicht eine Information pro Zeile (dann ginge das) sondern eine Information verteilt sich auf n bis m Zeilen.
Selbst wenn man das in eine Datenbank packt, muss man da erstmal eine 1 : n : m : keineahnungwieviele-Beziehung "aufbröseln". Ein paar (kleine) Testdateien sind hier zu finden: ![]() |
AW: Eine sehr große textbasierte Datei durchsuchen?
Wer sich mal richtig austoben will:
![]() 3010 Personen. Europäische Königshäuser. Kostenlose Windows-Software zum Anschauen: ![]() |
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:19 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz