![]() |
Seiten durchsuchen
Hallo Leute,
ich möchte ein Programm programmieren, das eine HTML-Datei einer Website runterlädt und in der Datei nach Links suchen. Das Programm soll alle Links rausschreiben. Wie bekomme ich das realiziert? |
AW: Seiten durchsuchen
Zitat:
Welche Art Antwort erwartest du jetzt? Gibt es bereits irgendwelche Ansätze, die du programmiert hast? Welchen Schwierigkeiten bist du dabei begegnet? So könnte man dir helfen. Aber eine komplette Anwendung schreibt dir hier niemand. |
AW: Seiten durchsuchen
Wenn Du nicht selbst parsen möchtest
Delphi-Quellcode:
implementation
uses mshtml; {$R *.dfm} Procedure WebBrowserCreateStringListHREF(const AWebBrowser: TWebBrowser;sl:TStrings) ; var nCount : Integer; elements : IHTMLElementCollection; element : IHTMLElement; sAnchor : String; begin if Assigned(AWebBrowser.Document) then begin elements:= (AWebBrowser.Document as IHTMLDocument2).all; for nCount := 0 To Pred(elements.Length) do begin element := elements.item(nCount, '') as IHTMLElement; if element.tagName = 'A' then begin sAnchor := (element as IHTMLAnchorElement).href; sl.Add(sAnchor); end; end; end; end; procedure TForm2.FormCreate(Sender: TObject); begin WebBrowser1.Navigate('www.google.de'); end; procedure TForm2.WebBrowser1NavigateComplete2(ASender: TObject; const pDisp: IDispatch; var URL: OleVariant); begin WebBrowserCreateStringListHREF(Webbrowser1,Listbox1.Items); end; |
AW: Seiten durchsuchen
Mit Indy runterladen (HTTP.Get) und mit pos/posex nach href suchen und mit Copy rauskopieren.
|
AW: Seiten durchsuchen
Zitat:
![]() |
AW: Seiten durchsuchen
Danke Leute,
ihr habt mir SEHR geholfen ;) Ganz besonders BUMMI :thumb: Nur eine Sache zu Bummi. Bei mir läuft das mit NavigateComplete nicht. Deswegen habe ich es an einem Button getestet. |
AW: Seiten durchsuchen
Zitat:
|
AW: Seiten durchsuchen
Zitat:
Hast du das Event auch an die TWebbrowser Komponente
Delphi-Quellcode:
im OI gebunden?
Webbrowser1.OnNavigateComplete2
Und um nur die Links zu bekommen ist ein TWebbrowser schon eine Bremse, denn der lädt ja (ist ja auch ein Browser) alle Bilder etc. herunter und rendert diese auch noch. Mit TIdHTTP wird nur die reine HTML-Datei geladen, wo aber alle Links enthalten sind. |
AW: Seiten durchsuchen
je nach dem was Du vor hast solltest Du Dir ein passendes Ereignis suchen, ein weiterer Kandidat wäre OnDocumentComplete ... das ist der Nachteil der asynchronen Methoden
|
AW: Seiten durchsuchen
Ich habe das nicht einfach kopiert!!!!
Es funktioniert wirklich nicht (mit dem Ereignis). Da werde ich mir morgen einfach ein anderes suchen. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 03:39 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz