Einzelnen Beitrag anzeigen

nahpets
(Gast)

n/a Beiträge
 
#2

AW: Plaintext aus .EML-Datei extrahieren?

  Alt 7. Apr 2016, 18:31
Ob plain/text oder html/text sollte im Contenttyp stehen.

Sowas in der Art: Content-Type: text/plain; charset="utf-8" bzw. Content-Type: text/html; charset="utf-8"

Wenn ich unbedingt aus HTML reinen Text machen muss, dann gehe ich so vor:
  1. Vor allen < einen Zeilenumbruch einfügen.
  2. Hinter allen > einen Zeilenumbruch einfügen.
  3. Alle Texte, die sich zwischen zwei mit < beginnenden Zeilen befinden, zu einer Zeile zusammenfügen.
  4. Aus allen Zeilen, die mit < beginnen, eine Leerzeile machen.
  5. Mehrere aufeinanderfolgende Leerzeilen durch eine Leerzeile ersetzen.
  6. "Überlange" Zeilen mit WrapText auf das gewünschte Maß "stutzen".
Dabei geht natürlich jegliche Textformatierung verloren.
  Mit Zitat antworten Zitat