AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Dateinamen mit UTF-8-Zeichen aus Directory lesen

Ein Thema von kwhk · begonnen am 5. Jul 2019 · letzter Beitrag vom 9. Jul 2019
Antwort Antwort
Seite 1 von 3  1 23      
Benutzerbild von kwhk
kwhk

Registriert seit: 25. Mär 2009
Ort: Dresden
168 Beiträge
 
Delphi 10.3 Rio
 
#1

Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 11:56
Durch Zufall bin ich darauf gestoßen, dass Dateinamen u.U. auch solche Zeichen enthalten können: ��
https://www.compart.com/de/unicode/U+1F49C

Ich hab ein Compare-Programm, mit dem ich die Directorys auslese und die Dateien mit einem anderen Directory vergleiche.
Die Dateien vom Smartphone, wo junge Leute gern solche Zeichen in ihren Namen aufnehmen und wo diese dann in Dateinamen stehen, lassen sich mit meinem Programm nicht vergleichen, weil aus dem Record von FindFirst / FindNext mittels Record.name nicht die UTF-8-Zeichen, sondern stattdessen Fragezeichen übergeben werden.

Der "normale" DIR Befehl liefert folgende Anzeige (analog FindFirst/FindNext)
Code:
02.07.2019  08:32    <DIR>         AB??C
02.07.2019  08:33    <DIR>         DE?F
30.08.2018  21:05            72.931 Hase Handy?? 5? Test.jpg
Wenn ich den DIR-Befehl folgendermaßen ausführe, kommt ein UTF-8 Ergebnis
(Leider werden diese Zeichen bei [ Code ] hier im Forum nicht angezeigt, bei [ Quote ] schon

Code:
chcp 65001
DIR *.*  >#dir65001.dir

02.07.2019  08:32    <DIR>         AB&#55357;&#56476;C
02.07.2019  08:33    <DIR>         DE&#8364;F
30.08.2018  21:05            72.931 Hase Handy&#55357;&#56476; 5&#8364; Test.jpg
Zitat:
chcp 65001
DIR *.* >#dir65001.dir

02.07.2019 08:32 <DIR> AB��C
02.07.2019 08:33 <DIR> DE€F
30.08.2018 21:05 72.931 Hase Handy�� 5€ Test.jpg
Ich habe es mit Csharp ( C# ) probiert

Code:
DirectoryInfo N1dirInfo = new DirectoryInfo(pN1Dir);        // Directory
FileInfo[] N1FileArr = N1dirInfo.GetFiles();                // Datei-Informationen
DirectoryInfo[] N1DirArr = N1dirInfo.GetDirectories("*.*"); // Unterordner-Informationen
Da bekomme ich die korrekten Dateinamen und kann damit diese Dateien auch verarbeiten.

Gibt es in Delphi auch eine etwas modernere Funktion, mit der man Directorys lesen kann,
also Dateinamen und auch Directory-Namen mit UTF-8 Zeichen ?
Hartmut

Geändert von kwhk ( 5. Jul 2019 um 12:04 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#2

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 12:18
In den neueren Delphis gibt es doch die Datei- bzw. Verzeichnisklasse. Hast du es damit schon mal probiert? Delphi bietet ja Jetzt auch eine vollständig Unicodeunterstützung.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.196 Beiträge
 
Delphi 10.4 Sydney
 
#3

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 14:19
Hast du wirklich Delphi 10.3 im Einsatz oder doch nicht ein altes Delphi?
Ab D2009 sollte es kein Problem mehr damit geben, außer du verwendest eigenen Implementierung um das auszulesen, welche noch fest auf die ANSI-Version der API gebungenden sind.
Ebenfalls ist die Verwendung von AnsiString "ungünstig", da diese natürlich Unicodestrings kaputt macht.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.275 Beiträge
 
Delphi 10.4 Sydney
 
#4

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 15:06
Hallo,
zur Not benutze Utf8Decode
Heiko
  Mit Zitat antworten Zitat
samso

Registriert seit: 29. Mär 2009
439 Beiträge
 
#5

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 20:33
Windows spricht entweder Ansi oder UTF-16 aber niemals UTF-8. Dein Code 55357;56476; entspricht 0xD83D 0xDC9C das ist Dein "Purple Heart" UTF-16 codiert.

Geändert von samso ( 5. Jul 2019 um 20:37 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#6

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 5. Jul 2019, 23:28
Code:
02.07.2019  08:32    <DIR>         AB??C
02.07.2019  08:33    <DIR>         DE?F
30.08.2018  21:05            72.931 Hase Handy?? 5? Test.jpg
Falls diese unmotivierten Fragezeichen in einer Ausgabe auftauchen (oder auch gefüllte oder leere Rechtecke) dann handelt es sich um Ersatzzeichen des verwendeten Fonts die immer dann ausgegeben werden wenn eine Codierung nicht durch ein zugeordnetes Zeichen repräsentiert werden kann.

Wenn Du also eine zuverlässige Aussage über die verwendeten Zeichen(-Kodierung) treffen willst, geht kein Weg an einem HexDump vorbei.

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
peterbelow

Registriert seit: 12. Jan 2019
Ort: Hessen
701 Beiträge
 
Delphi 12 Athens
 
#7

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 6. Jul 2019, 12:03

Gibt es in Delphi auch eine etwas modernere Funktion, mit der man Directorys lesen kann,
also Dateinamen und auch Directory-Namen mit UTF-8 Zeichen ?
Versuch mal die Routinen aus der System.IOUtils unit. Die sind auch platformneutral.
Peter Below
  Mit Zitat antworten Zitat
Benutzerbild von kwhk
kwhk

Registriert seit: 25. Mär 2009
Ort: Dresden
168 Beiträge
 
Delphi 10.3 Rio
 
#8

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 6. Jul 2019, 13:47
Hier die DIR-Listings als ASC und UTF8, auch HEX. Und die Version meines Delphi10.3.
Miniaturansicht angehängter Grafiken
10utf8asc.jpg   delphi10info.jpg  
Hartmut

Geändert von kwhk ( 6. Jul 2019 um 13:54 Uhr)
  Mit Zitat antworten Zitat
samso

Registriert seit: 29. Mär 2009
439 Beiträge
 
#9

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 6. Jul 2019, 20:24
Also bei mir spielt das ganz wunderbar seit Delphi 2009 (unter Benutzung Sysutils.Findfirst/Findnext). Anbei Demoprogramm mit Delphi 10.1. Da der String in SearchRec.Name UTF-16 codiert ist, hat jeder Char 16 Bit. Das erste Herz wird dann mit zwei Chars mit den Hexwerten $D83D, $DC9C codiert (so wie in Deinem Beispiel). Wenn man möchte kann man den String auch zu UTF-8 umkodieren. Dazu genügt die Umwandlung UTF8String(SearchRec.Name).
Miniaturansicht angehängter Grafiken
testdir.png  
Angehängte Dateien
Dateityp: zip Projekte 10.1.zip (51,8 KB, 5x aufgerufen)

Geändert von samso ( 6. Jul 2019 um 21:07 Uhr) Grund: Demoprogramm um Hexdarstellung erweitert
  Mit Zitat antworten Zitat
KarstenK

Registriert seit: 4. Dez 2007
Ort: Bärenthal
29 Beiträge
 
Delphi 2009 Enterprise
 
#10

AW: Dateinamen mit UTF-8-Zeichen aus Directory lesen

  Alt 6. Jul 2019, 21:00
Im Hex dump utf8 stehen sie doch richtig drin.
Bist Du sicher das dein Verwendeter Font diese Zeichen auch unterstützt?
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 3  1 23      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 21:23 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz