AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren

HTML Datei parsen

Ein Thema von EConvertError · begonnen am 23. Jun 2004 · letzter Beitrag vom 25. Jun 2004
 
EConvertError

Registriert seit: 29. Sep 2003
Ort: Österreich
230 Beiträge
 
#11

Re: HTML Datei parsen

  Alt 24. Jun 2004, 13:08
Vielen Dank für eure Geduld!

Das mit dem HTML Parser sieht sehr verlockend für mich aus.

Allerdings habe ich schon ein wenig Code, der aber immer scheitert, weil irgendwie eine Endlosschleife entsteht. Vielleicht könnt ihr euch den ansehen. Falls der Fehler nicht gefunden wird, werde ich zur HTML Parser Kompo greifen.

Delphi-Quellcode:
procedure TForm1.Button1Click(Sender: TObject);
var
  StrList: TStringList;
begin
  StrList:= TStringList.Create;
  StrList.LoadFromFile('result.htm'); //die HTML Datei (siehe Anhang des ersten Post)
  ParseStringList(StrList);
  StrList.Free;
end;

procedure TForm1.ParseStringList(const StrList: TStrings);
var
  I, C, Index: Integer;
begin
  I:= 0;
  while StrList[I] <> 'do
  begin
    if StrList[I]= '<tr bgcolor="#C6D6D6">then begin //danach kommt eine Zeile in der Tabelle
      Index:= I;
      for C:= 1 to 9 do begin //eine Zeile in der Tabelle entspricht 9 Zeilen HTML Code
        Inc(Index);
        ParseLine(StrList[Index]);
      end;
    end;
    Inc(I);
  end;
end;

procedure TForm1.ParseLine(Line: String);
var
  FPos, SecPos: Integer;
begin
  Line:= Trim(Line);
  while Pos('<', Line) > 0 do begin
    FPos:= Pos('<', Line);
    SecPos:= Pos('>', Line);
    Delete(Line, FPos, SecPos-FPos+1);
  end;
  Memo1.Lines.Add(Line); //Anzeigen zu Testzwecken
end;
Mit freudlichen Grüßen,
EConvertError
Andreas N.
  Mit Zitat antworten Zitat
 

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:25 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz