Delphi-PRAXiS
Seite 2 von 2     12   

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Microsoft Word Datei erkennen (nicht über Dateiendung) (https://www.delphipraxis.net/41505-microsoft-word-datei-erkennen-nicht-ueber-dateiendung.html)

jim_raynor 7. Mär 2005 08:30

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Ich würde dir empfehlen auch den Dateinamen oder zumindestens die Dateierweiterung im Archiv zu speichern. Damit umgehst du eine Menge Probleme. Du kannst nicht jeden Dateitypen exakt bestimmen.

Brainshock 8. Mär 2005 07:09

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Na hi,

@jim_raynor:

Danke, für deinen Hinweis, aber das hilft mir an dieser Stelle auch nicht weiter. Zumal ich der Meinung bin, dass es wenigstens bei MS Office Dateien möglich sein sollte diese aus irgendeiner Kennung zu bestimmen (es ging ja auch mit den alten Versionen).

(So kommt man natürlich auch auf eine hohe Post-Zahl. :wink: )

@all:

Hat sonst noch jemand irgendwelche Hinweise, wie man plausibel die MS Office Dateien bestimmen kann, also nix mit Dateiendung?

mfg
Matthias

alcaeus 8. Mär 2005 07:18

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Du könntest (jetzt mal für Word als Bsp.) eine leere Datei machen und speichern, und anschließend eine Datei mit dem Inhalt "Text" machen und speichern. Nun kannst du die Dateien vergleichen, und Bereiche bestimmen, die immer gleich sind (die müsste es geben).

Greetz
alcaeus

MagicAndre1981 8. Mär 2005 12:20

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Jede Datei hat doch einen Dateiheader in der drinne steht um was für einen Typ es sich handelt. Ein Beispiel ist "GIF89". Damit erkennt man, dass es sich um eine GIF-Datei handelt. So etwas müsste doch auch mit Word-Dateien gehen, wenn man den Header kennt.

André

toms 8. Mär 2005 13:03

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Hallo,

Man koennte auch mittels Bei Google suchenStgOpenStorage usw. auslesen, ob es sich um eine Word
datei Handelt.

Brainshock 8. Mär 2005 14:20

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Mhhh,

das mit dem Dateiheader ist mir schon klar, nur ist der bei allen MS Office Dateiarten gleich ( in den neuen Versionen). Das hilft mir also nicht besonders weiter und wäre nur eine sekundäre Kontrollmöglichkeit.

@toms: Keine Ahnung was "StgOpenStorage" genau ist, aber ich schaue es mir mal an.

Mfg
Matthias

scp 8. Mär 2005 15:32

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Habe eine Gemeinsamkeit der Dateitypen gefunden, die Lösung liegt im Footer nicht im Header:
Am Ende beider Typen befindet sich ein sogenannter Root Entry, der auch passenderweise immer mit "R.o.o.t. .E.n.t.r.y." beginnt (die Punkte stehen hier für nullwertige Bytes).
Bei Excel ist dieser 512 Bytes gross, bei Word 2048 Bytes.
Bei beiden Typen kommt 80 Bytes nach "R.o.o.t. .E.n.t.r.y." die CLSID. Bei Word ist dies
Code:
06 09 02 00  00 00  00 00  C0 00  00 00 00 00 00 46
{00020906-0000-0000-C000-000000000046}
Microsoft Word-Dokument
un bei Excel
Code:
00 02 08 20  00 00  00 00  C0 00  00 00 00 00 00 46
{00020820-0000-0000-C000-000000000046}
Microsoft Excel-Arbeitsblatt
PS: Getestet mit Office 97 und XP

Jens Schumann 8. Mär 2005 16:25

Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
 
Hallo,
da es nach wie vor bei den Office Dateien um sog. Compound Documents handelt würde ich versuchen über das IStorage Interface darauf zu zugreifen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 20:57 Uhr.
Seite 2 von 2     12   

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz