Thema: Delphi html code parsen

Einzelnen Beitrag anzeigen

Benutzerbild von RWarnecke
RWarnecke

Registriert seit: 31. Dez 2004
Ort: Stuttgart
4.408 Beiträge
 
Delphi XE8 Enterprise
 
#2

Re: html code parsen

  Alt 10. Feb 2009, 15:49
Den folgenden Sourcecode habe ich mal gefunden :
Delphi-Quellcode:
// Extract plain text from html string

function StripHTMLTags(const strHTML: string): string;
var
  P: PChar;
  InTag: Boolean;
  i, intResultLength: Integer;
begin
  P := PChar(strHTML);
  Result := '';

  InTag := False;
  repeat
    case P^ of
      '<': InTag := True;
      '>': InTag := False;
      #13, #10: ; {do nothing}
    else
      if not InTag then
       begin
         if (P^ in [#9, #32]) and ((P+1)^ in [#10, #13, #32, #9, '<']) then
         else
           Result := Result + P^;
       end;
    end;
    Inc(P);
  until (P^ = #0);

  {convert system characters}
  Result := StringReplace(Result, '"', '"', [rfReplaceAll]);
  Result := StringReplace(Result, '&apos;', '''', [rfReplaceAll]);
  Result := StringReplace(Result, '>', '>', [rfReplaceAll]);
  Result := StringReplace(Result, '<', '<', [rfReplaceAll]);
  Result := StringReplace(Result, '&', '&', [rfReplaceAll]);
  {here you may add another symbols from RFC if you need}
end;
erstellt durch Code-Orakel und dem BBCode-Plugin.

Vielleicht hilft er Dir ja weiter.
Rolf Warnecke
App4Mission
  Mit Zitat antworten Zitat