Registriert seit: 31. Dez 2004
Ort: Stuttgart
4.408 Beiträge
Delphi XE8 Enterprise
|
Re: html code parsen
10. Feb 2009, 15:49
Den folgenden Sourcecode habe ich mal gefunden :
Delphi-Quellcode:
// Extract plain text from html string
function StripHTMLTags( const strHTML: string): string;
var
P: PChar;
InTag: Boolean;
i, intResultLength: Integer;
begin
P := PChar(strHTML);
Result := ' ';
InTag := False;
repeat
case P^ of
' <': InTag := True;
' >': InTag := False;
#13, #10: ; {do nothing}
else
if not InTag then
begin
if (P^ in [#9, #32]) and ((P+1)^ in [#10, #13, #32, #9, ' <']) then
else
Result := Result + P^;
end;
end;
Inc(P);
until (P^ = #0);
{convert system characters}
Result := StringReplace(Result, ' "', ' "', [rfReplaceAll]);
Result := StringReplace(Result, ' '', ' '' ', [rfReplaceAll]);
Result := StringReplace(Result, ' >', ' >', [rfReplaceAll]);
Result := StringReplace(Result, ' <', ' <', [rfReplaceAll]);
Result := StringReplace(Result, ' &', ' &', [rfReplaceAll]);
{here you may add another symbols from RFC if you need}
end;
erstellt durch Code-Orakel und dem BBCode-Plugin.
Vielleicht hilft er Dir ja weiter.
|
|
Zitat
|