AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

TIdHTTP, Inhalt einer Seite ermitteln

Ein Thema von hoika · begonnen am 21. Jun 2012 · letzter Beitrag vom 21. Jun 2012
 
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#2

AW: TIdHTTP, Inhalt einer Seite ermitteln

  Alt 21. Jun 2012, 17:14
So würde es mit dem WebBrowser-Control gehen (ist halt viiiel einfacher als mit Indy + HTML parsen).
WebBrowser-Komponente auf's Formular klatschen und mit .Navigate()-Methode die Seite runterladen/anzeigen.

Dann hier erst einmal etwas Code zum auslesen von Links:
Delphi-Quellcode:
type
   TOnExtractLink = procedure(const URL:string) of object;
procedure ExtractDocumentLinks(const Document: IDispatch; callback:TOnExtractLink);
var
   doc, links, link : OleVariant;
   i : Integer;
begin
   doc := Document;

   links := doc.links;

   for i:=0 to links.Length-1 do
   begin
      link := links.item(i);
      callback(link.HREF);
   end;
end;

procedure ExtractWBLinks(WebBrowser: TWebBrowser; callback:TOnExtractLink);
begin
   if not Assigned(WebBrowser.Document) then
      Exit;
   ExtractDocumentLinks(WebBrowser.Document, callback);
end;
Dann braucht man nur noch einen Handler für die Callback-Methode:
Delphi-Quellcode:
procedure TMainForm.AddLinkToList(const url: string);
var
   url2 : string;
   pp : Integer;
   ignore_anchors : Boolean;
begin
   ignore_anchors := True; // Sollen Anker in der URL unterdrückt werden?
   if ignore_anchors then
   begin
      pp := Pos('#', url);
      if pp > 0 then
         url2 := copy(url, 1, pp-1)
      else
         url2 := url;
   end
   else
      url2 := url;

   if LbxLinkList.Items.IndexOf(url2) <> -1 then
      Exit;
   LbxLinkList.Items.Add(url2); // URL in Listbox eintragen
end;

LbxLinkList.Clear;
ExtractWBLinks(WebBrowser1, AddLinkToList);
Andreas
  Mit Zitat antworten Zitat
 


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:14 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz