Zitat von
Andreas L.:
Hi,
ich bastel derzeit an einen RTF-Parser. In einer RTF-Datei werden in der ersten Zeile sämtliche, verwendete Schriftarten abgelegt und mit fortlaufenden Variablen verknüpft.
Ein kompletter "Header" mit 3, seltsamerweise gleichen, Schriftarten sieht so aus:
Code:
{\rtf1\
ansi\ansicpg1252\deff0\deflang1031{\fonttbl{\f0\fnil\fcharset0 MS Sans-serif;}{\f1\fnil MS Sans Serif;}{\f2\fnil\fcharset0 MS Sans Serif;}}
Dir sollte klar sein, dass die Aussage so Unsinn ist.
Die Schriftarten müssen nicht in der ersten Zeile stehen. Zeilenumbrüche in einer RTF-Datei gelten als Leerzeichen und können auch überall dort benutzt werden, wo Leerzeichen erlaubt sind. Du solltest nicht mit einer TStringList arbeiten sondern mit einem einzigen String (die Datei in einen TStringStream lesen).
RTF ist ein strukturiertes Format, das man rekursiv parsen kann. Alles zwischen zwei geschweiften Klammern {} bildet jeweils einen Block, wobei ein Backslash \ als Escapezeichen benutzt wird. Die vollständige Spezifikation findest du bei
Microsoft.
Es kann übrigens auch "Löcher" in der Nummerierung der Schriften geben, sprich: {\f1 ...}{\f17 ...} ist zulässig. Die Schriftfamilie ist auch nicht immer \fnil sondern kann z.B. auch \fswiss oder \froman sein. Gerade bei MS Sans Serif sollte sie eigentlich \fswiss sein.
Hier als Beispiel mal ein "dicker" RTF-Header:
Code:
{\rtf1\
ansi\ansicpg1252\uc1\deff1\stshfdbch0\stshfloch0\stshfhich0\stshfbi0\deflang1031\deflangfe1031{\fonttbl{\f0\froman\fcharset0\fprq2{\*\panose 02020603050405020304}Times New Roman;}{\f1\fswiss\fcharset0\fprq2{\*\panose 020b0604020202020204}Arial;}
{\f3\froman\fcharset2\fprq2{\*\panose 05050102010706020507}Symbol;}{\f37\froman\fcharset238\fprq2 Times New Roman CE;}{\f38\froman\fcharset204\fprq2 Times New Roman Cyr;}{\f40\froman\fcharset161\fprq2 Times New Roman Greek;}
{\f41\froman\fcharset162\fprq2 Times New Roman Tur;}{\f42\froman\fcharset177\fprq2 Times New Roman (Hebrew);}{\f43\froman\fcharset178\fprq2 Times New Roman (Arabic);}{\f44\froman\fcharset186\fprq2 Times New Roman Baltic;}
{\f45\froman\fcharset163\fprq2 Times New Roman (Vietnamese);}{\f47\fswiss\fcharset238\fprq2 Arial CE;}{\f48\fswiss\fcharset204\fprq2 Arial Cyr;}{\f50\fswiss\fcharset161\fprq2 Arial Greek;}{\f51\fswiss\fcharset162\fprq2 Arial Tur;}
{\f52\fswiss\fcharset177\fprq2 Arial (Hebrew);}{\f53\fswiss\fcharset178\fprq2 Arial (Arabic);}{\f54\fswiss\fcharset186\fprq2 Arial Baltic;}{\f55\fswiss\fcharset163\fprq2 Arial (Vietnamese);}}