AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Bestimmte Werte aus HTML Quelltext extrahieren
Thema durchsuchen
Ansicht
Themen-Optionen

Bestimmte Werte aus HTML Quelltext extrahieren

Ein Thema von goenner90 · begonnen am 13. Jul 2008 · letzter Beitrag vom 14. Jul 2008
Antwort Antwort
Seite 2 von 2     12   
c.wuensch

Registriert seit: 19. Dez 2004
Ort: Münster
96 Beiträge
 
#11

Re: Bestimmte Werte aus HTML Quelltext extrahieren

  Alt 13. Jul 2008, 22:42
Mal ne etwas andere Idee:
Muss es denn unbedingt aus dem Quelltext extrahiert werden? Wenn du das Ganze schon im TWebbrowser geöffnet hast, dann kannst du wunderbar über die HTML-DOM-Struktur auf die einzelnen Objekte des Dokuments zugreifen.

So kannst du z.B. ganz einfach den Titel der Webseite verändern (oder auslesen):
Delphi-Quellcode:
uses MSHTML;
var s: String;
...
s := IHtmlDocument2(Webbrowser1.Document).Title;
IHtmlDocument2(Webbrowser1.Document).Title := 'Neuer Titel';
Und für alle anderen Objekte und deren Attributwerte ist das ebenfalls möglich (hab mich damit mal länger beschäftigt, finde das aber im Moment nicht...)
  Mit Zitat antworten Zitat
Benutzerbild von toms
toms
(CodeLib-Manager)

Registriert seit: 10. Jun 2002
4.648 Beiträge
 
Delphi XE Professional
 
#12

Re: Bestimmte Werte aus HTML Quelltext extrahieren

  Alt 14. Jul 2008, 07:25
Hallo, folgender Code basiert auf marabus Code.
Musst natürlich den Code noch etwas umschreiben, da du ja die Daten nicht in ein Stringgrid übertragen möchtest.

Delphi-Quellcode:
uses MSHTML;

// IHTMLDocument2 eines Frames ermitteln
function GetFrameDoc(doc: IHTMLDocument2; v: OleVariant): IHTMLDocument2;
var
  win: IHTMLWindow2;
  u: IUnknown;
begin
  u := doc.frames.item(v);
  if Assigned(u)
  and Succeeded(u.QueryInterface(IHTMLWindow2, win))
    then Result := win.Document
    else Result := nil;
end;

// IHTMLTable nr. iTableNr eines IHTMLDocument2 ermitteln
function GetTable(doc: IHTMLDocument2; iTableNr: OleVariant; var t: IHTMLTable): Boolean;
var
  ec: IHTMLElementCollection;
  e2: IHTMLElement2;
begin
  Result := True;
  e2 := doc.body as IHTMLElement2;
  ec := e2.getElementsByTagName('table');
  if ec.length > 0
    then t := ec.item(iTableNr, null) as IHTMLTable
    else REsult := False;
end;

// Zellen einer Zeile in ein Stringgrid übertragen
procedure GetCells(tr: IHTMLTableRow; sg: TStringGrid; index: Integer);
var
  i: Integer;
  ec: IHTMLElementCollection;
  e: IHTMLElement;
  s: TStrings;
begin
  s := sg.Rows[index];
  s.Clear;
  ec := tr.cells;
  if sg.ColCount < ec.Length then
    sg.ColCount := ec.length;
  for i := 0 to Pred(ec.length) do
  begin
    e := ec.item(i, null) as IHTMLElement;
    s.Add(e.innerText);
  end;
end;

// IHTMLTable in Stringgrid übertragen
procedure GetRows(t: IHTMLTable; sg: TStringGrid);
var
  i: Integer;
  ec: IHTMLElementCollection;
begin
  ec := t.rows;
  sg.RowCount := ec.length;
  for i := 0 to Pred(ec.length) do
    GetCells(ec.item(i, null) as IHTMLTableRow, sg, i);
end;

procedure TForm1.Button2Click(Sender: TObject);
var
 iDoc2 : IHTMLDocument2;
 itable: IHTMLTable;
 row: IHTMLTableRow;
 i: Integer;
begin
  if assigned(Webbrowser1.Document) then
  begin
    iDoc2 := Webbrowser1.Document as IHTMLDocument2;
    if Assigned(iDoc2) then
    begin
      iDoc2 := GetFrameDoc(iDoc2, 1); // IHTMLDocument2 von frame Nr. 1 ermitteln
      if Assigned(iDoc2) then
      begin
        if Assigned(iDoc2) then
        if GetTable(iDoc2, 0, itable) then // erste Tabelle
          begin
            GetRows(itable, Stringgrid1);
          end;
      end;
    end;
  end;
end;
Thomas
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:49 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz