![]() |
Directory und Files auflisten
Hallo Delphi Freunde
ich bin Hobbyprogrammierer und liebe Delphi, manchmal fehlt mir aber die Erfahrung, da ich nicht so oft etwas programmiere. Im Moment will ich mir eine Liste von Verzeichnissen und Dateien einlesen und später in eine Datenbank schreiben um die Dateien besser suchen, sortieren und kategorisieren zu können. Zur Zeit habe ich erstmal eine Listbox für die Haupverzeichnisse und ein Grid zum anzeigen der Pfade und Dateinamen angelegt. Ich benutze Delphi Rio 3.2 und die TMS Komponenten wenn nötig. Einerseits soll das Einlesen der Dateinamen möglichst effektiv und schnell funktionieren, andererseits will ich aber auch nicht immer wieder das Rad neu erfinden. Als erstes habe ich mal den Befehl TDirectory.GetDirectories benutzt um die Verzeichnisse einzulesen. Bei normalen Verzeichnissen flutscht das auch recht gut. Eine Verzeichnis hat jedoch etwa 14000 Unter-Verzeichnisse und 480000 Dateien, da dauert das einlesen knapp 2 Minuten. Ich hatte schon überlegt die einzelen Hautverzeichnisse in verschiedenen Threads durchsuchen zu lassen, da das Formular mit "keine Rückmeldung" einige Zeit einfriert, bis dieses große Verz. gelesen worden ist. 1. Bringt es überhaupt etwas mit mehreren Tasks die Verz. gleichzeitig durchsuchen zu lassen ? (Dateien liegen auf einem NAS mit normaler Festplatte) 2. Gibt es einen Befehl der die Größe eines Verzeichnises anzeigt ohne das ganze Verz. zu durchsuchen ? (Um festzustellen wo es sich lohnt zu optimieren) 3. Sind selbstgeschriebene Routinen mit FindFirst,FindNext schneller ? 4. Gibt es auch eine TMS-Komponente die das machen kann, ohne was anzuzeigen wie TAdvTreeView oder TAdvDirectoryList und sind die schneller als GetDirectory ? Hier etwas Code den ich dazu geschrieben habe:
Delphi-Quellcode:
In der "for I := Low(SearchResult) to High(SearchResult) do" Schleife soll später noch mehr ausgewertet werden (Datum,Dateigröße usw.)
procedure TForm1.btnStartClick(Sender: TObject);
var // SearchResult MainVerz: TStringDynArray; I: Integer; // var i:Integer; SearchResult: TStringDynArray; StartTime: TTime; begin Grid.RowCount := 1000; // High(SearchResult); Grid.FixedCols := 1; Grid.ColCount := 3; Grid.StartUpdate; AktLine := 1; // Alle Hauptverzeichnisse einlesen und dann pro Verz. eine Suche ausführen in eigenem Thread MainVerz := TDirectory.GetDirectories('Y:\Dateien\', TSearchOption.soTopDirectoryOnly, nil); for j := 0 to High(MainVerz) do begin ListBox1.Items.Add(MainVerz[j]); try Begin // Einlesen der Dateien ab dem Verz[j] StartTime := Now(); SearchResult := TDirectory.GetFiles(MainVerz[j], '*.pdf', TSearchOption.soAllDirectories); for I := Low(SearchResult) to High(SearchResult) do begin if SearchResult[I] <> '' then begin Grid.Cells[1, AktLine] := ExtractFilename(SearchResult[I]); Grid.Cells[2, AktLine] := ExtractFilePath(SearchResult[I]); inc(AktLine); end; end; TaskStatus[j] := True; ListBox1.Items.Add(' Zeit: ' + TimeToStr(Now - StartTime)); // Application.ProcessMessages; End; except { Catch the possible exceptions } MessageDlg('Incorrect path or search mask', mtError, [mbOK], 0); Exit; end; end; Grid.RowCount := AktLine; Grid.AutoSizeCol(1); Grid.AutoSizeCol(2); Grid.SortSettings.IgnoreCase := True; Grid.Sort(1, sdAscending); Grid.SortSettings.Show := True; Grid.EndUpdate; end; Abwägen zwischen Geschwindigkeit und Einfachheit. Wenn es bei 2 Minuten Dauer 10 Sekunden mehr oder weniger sind ist das nicht viel, aber den Minutenbereich möchte ich schon umgehen wenn möglich. Wenn schon mit threads gearbeitet werden muss dachte ich an "OmniThreadLibrary". Ein Thread ist ja nicht schlimm aber mehrere, damit es sich auch lohnt (CPU Cores ausnutzen) das ist ohne die Lib schon schwierig, wie ich festgestellt habe. |
AW: Directory und Files auflisten
Bei Festplattenzugriffen sind mehrere Threads nicht immer sinnvoll, da die Schreib- und Leseköpfe ja auch nur an einer Stelle sein können. Im Gegenteil, mehrere Threads können dazu führen, dass sie unnötig oft hin und her springen müssen, was der Performance dann eher abträglich ist.
Aber eine Forensuche nach zum Beispiel FindFirstFile und ähnlichen sollte genügen Material zu Tage fördern. |
AW: Directory und Files auflisten
Es gibt/gab Festplatten die eine sog. verschränkte Suche beherrschen. Bei denen könnte es etwas bringen mit mehreren Threads die Platte zu bearbeiten. Was auf jeden Fall empfehlenswert ist, die Plattenzugriffe und die Anzeige per Thread voneinander zu trennen. Und für den Aufbau der angezeigten Daten mit BeginUpdate/EndUpdate arbeiten, sofern das unterstützt wird.
Gruß K-H |
AW: Directory und Files auflisten
Und bei SSDs wäre es egal. Da würde ich dann auf die zusätzliche Komplexität mit mehreren Threads verzichten. Ergo: Ein zusätzlicher Thread, um die Aufgabe von der GUI zu trennen. Und den Programmcode innerhalb dieses Threads optimieren. Wobei, ein 5-Minuten-Ei wird man nie in 3 Minuten gekocht bekommen. :cyclops:
|
AW: Directory und Files auflisten
[OT] Aber du willst es doch immer 4 1/2 Minuten gekocht haben. Vielleicht stimmt mit deinem Gefühl etwas nicht. [/OT]
|
AW: Directory und Files auflisten
Gut gebrüllt Löwe DeddyH, Loriot ist immer noch gut.
Dass es andere Verfahren zum einlesen gibt weiß ich, deshalb meine Frage, was bringen die anderen Lösungen ? Ist FindFirstFile schneller als .GetDirectories ? |
AW: Directory und Files auflisten
Zitat:
In #3 und #4 wurde IHMO das Wesentliche bereits geschrieben. |
AW: Directory und Files auflisten
Zitat:
So. Jetzt aber bitte zurück zum Thema. |
AW: Directory und Files auflisten
Ich habe jetzt mal ausprobiert was es ausmacht mit 4 Threads zu arbeiten.
Habe die Omnithread Lib benutzt und damit mein großes Verzeichnis eingelesen. 14019 Verzeichnisse 48488 Dateien Mit OmniThread Zeit: 01:46:370 Ohne Threads Zeit: 01:56:908 Der Unterschied ist also kaum spürbar, zumindest wenn die Suche über ein Netzwerklaufwerk läuft. |
AW: Directory und Files auflisten
Eine andere Sache ist hierbei aufgetreten.
Möglicherweise hat dazu jemand eine Idee. Wenn ich in mein Programm ein Application.ProcessMessages einbaue, hängt das Programm an dieser Stelle und muss mit dem Taskmanager beendet werden. Hier das Programm dazu:
Delphi-Quellcode:
// **************************************************************************
procedure TForm1.btnStartClick(Sender: TObject); var // SearchResult MainVerz: TStringDynArray; SearchResult: TStringDynArray; StartTime, FirstTime: TTime; I: Integer; begin for I := 0 to 10 do TaskStatus[I] := False; Grid.RowCount := 1000; // High(SearchResult); Grid.FixedCols := 1; Grid.ColCount := 3; Grid.StartUpdate; AktLine := 1; // Uses IOUtils für GetDir..und System.Types für DynArray hinzufügen // Alle Hauptverzeichnisse einlesen und dann pro Verz. eine Suche ausführen in eigenem Thrad StartTime := Now(); FirstTime := Now; MainVerz := TDirectory.GetDirectories('Y:\eBooks\eLoad24', TSearchOption.soTopDirectoryOnly, nil); for j := 0 to High(MainVerz) do begin ListBox1.Items.Add(MainVerz[j]); try Begin // Einlesen der Dateien ab dem Verz[j] SearchResult := TDirectory.GetFiles(MainVerz[j], '*.pdf', TSearchOption.soAllDirectories); for I := Low(SearchResult) to High(SearchResult) do begin if SearchResult[I] <> '' then begin Grid.Cells[1, AktLine] := ExtractFilename(SearchResult[I]); Grid.Cells[2, AktLine] := ExtractFilePath(SearchResult[I]); inc(AktLine); end; end; TaskStatus[j] := True; ListBox1.Items.Add('Task ' + IntToStr(j) + ' Zeit: ' + FormatDateTime('hh:nn:ss:zzz', Now - StartTime)); StartTime := Now(); // Application.ProcessMessages; End; except { Catch the possible exceptions } MessageDlg('Incorrect path or search mask', mtError, [mbOK], 0); Exit; end; // Application.ProcessMessages; end; ListBox1.Items.Add('--------------------------------------------'); ListBox1.Items.Add('Gesamt Zeit: ' + FormatDateTime('hh:nn:ss:zzz', Now - FirstTime)); Grid.RowCount := AktLine; Grid.AutoSizeCol(1); Grid.AutoSizeCol(2); Grid.SortSettings.IgnoreCase := True; Grid.Sort(1, sdAscending); Grid.SortSettings.Show := True; Grid.EndUpdate; end; // ************************************************************************** |
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:46 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz