![]() |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Ich würde dir empfehlen auch den Dateinamen oder zumindestens die Dateierweiterung im Archiv zu speichern. Damit umgehst du eine Menge Probleme. Du kannst nicht jeden Dateitypen exakt bestimmen.
|
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Na hi,
@jim_raynor: Danke, für deinen Hinweis, aber das hilft mir an dieser Stelle auch nicht weiter. Zumal ich der Meinung bin, dass es wenigstens bei MS Office Dateien möglich sein sollte diese aus irgendeiner Kennung zu bestimmen (es ging ja auch mit den alten Versionen). (So kommt man natürlich auch auf eine hohe Post-Zahl. :wink: ) @all: Hat sonst noch jemand irgendwelche Hinweise, wie man plausibel die MS Office Dateien bestimmen kann, also nix mit Dateiendung? mfg Matthias |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Du könntest (jetzt mal für Word als Bsp.) eine leere Datei machen und speichern, und anschließend eine Datei mit dem Inhalt "Text" machen und speichern. Nun kannst du die Dateien vergleichen, und Bereiche bestimmen, die immer gleich sind (die müsste es geben).
Greetz alcaeus |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Jede Datei hat doch einen Dateiheader in der drinne steht um was für einen Typ es sich handelt. Ein Beispiel ist "GIF89". Damit erkennt man, dass es sich um eine GIF-Datei handelt. So etwas müsste doch auch mit Word-Dateien gehen, wenn man den Header kennt.
André |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Hallo,
Man koennte auch mittels ![]() datei Handelt. |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Mhhh,
das mit dem Dateiheader ist mir schon klar, nur ist der bei allen MS Office Dateiarten gleich ( in den neuen Versionen). Das hilft mir also nicht besonders weiter und wäre nur eine sekundäre Kontrollmöglichkeit. @toms: Keine Ahnung was "StgOpenStorage" genau ist, aber ich schaue es mir mal an. Mfg Matthias |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Habe eine Gemeinsamkeit der Dateitypen gefunden, die Lösung liegt im Footer nicht im Header:
Am Ende beider Typen befindet sich ein sogenannter Root Entry, der auch passenderweise immer mit "R.o.o.t. .E.n.t.r.y." beginnt (die Punkte stehen hier für nullwertige Bytes). Bei Excel ist dieser 512 Bytes gross, bei Word 2048 Bytes. Bei beiden Typen kommt 80 Bytes nach "R.o.o.t. .E.n.t.r.y." die CLSID. Bei Word ist dies
Code:
un bei Excel
06 09 02 00 00 00 00 00 C0 00 00 00 00 00 00 46
{00020906-0000-0000-C000-000000000046} Microsoft Word-Dokument
Code:
PS: Getestet mit Office 97 und XP
00 02 08 20 00 00 00 00 C0 00 00 00 00 00 00 46
{00020820-0000-0000-C000-000000000046} Microsoft Excel-Arbeitsblatt |
Re: Microsoft Word Datei erkennen (nicht über Dateiendung)
Hallo,
da es nach wie vor bei den Office Dateien um sog. Compound Documents handelt würde ich versuchen über das IStorage Interface darauf zu zugreifen. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 20:57 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz