Einzelnen Beitrag anzeigen

Benutzerbild von sx2008
sx2008

Registriert seit: 16. Feb 2008
Ort: Baden-Württemberg
2.332 Beiträge
 
Delphi 2007 Professional
 
#6

AW: Text aus Word.DOC extrahieren (MS-Word 97-2003-Binär-Format:)

  Alt 6. Jan 2014, 12:46
Das binäre Word-Format setzt auf Windows Structured Storage auf.
Jeder Versuch das Word-Format direkt zu lesen und Structured Storage zu ignorieren ist von vornerein zum Scheitern verurteilt.
Man muss die StgOpenStorageEx()-Funktion verwenden und sich mit der überkomplizierten Microsoft-API rumschlagen.
Wenn man das schön in Delphi-Klassen verpackt bekommt man vielleicht auch eine API die man benützen kann.

Aber einfach so direkt in die Datei reingreifen - vergiss es.

PS: die Jedi Code Library enthält die Unit JclStructStorage.pas die schon mal einige grundlegende Klassen enthält.
fork me on Github

Geändert von sx2008 ( 6. Jan 2014 um 12:52 Uhr)
  Mit Zitat antworten Zitat