AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Website durchsuchen
Thema durchsuchen
Ansicht
Themen-Optionen

Website durchsuchen

Ein Thema von Mark90 · begonnen am 25. Aug 2007 · letzter Beitrag vom 26. Aug 2007
Antwort Antwort
Seite 2 von 3     12 3      
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#11

Re: Website durchsuchen

  Alt 25. Aug 2007, 14:27
Hallo,

mit der Indy HTTP-Client-Komponente kannst du dir eine Datei per HTTP vom Server holen. Dann brauchst du einen Parser, der dir den komfortablen Zugriff auf ein HTML-Dokument gestattet und da bietet sich MSHTML an, weil es auf jedem PC vorhanden ist. Wenn du jetzt den per HTTP geholten Seitenquelltext z.B. mit der Funktion GetDocument() in ein IHTMLDocument lädst, dann kannst du mit ExtractLinks() alle Verweise in eine StringList übertragen.

Freundliche Grüße
  Mit Zitat antworten Zitat
Benutzerbild von Catbytes
Catbytes

Registriert seit: 7. Sep 2002
Ort: Heckendalheim
353 Beiträge
 
Delphi XE5 Enterprise
 
#12

Re: Website durchsuchen

  Alt 25. Aug 2007, 14:56
Zitat von marabu:
...und da bietet sich MSHTML an, weil es auf jedem PC vorhanden ist...
Wirklich auf jedem?
Catbytes
  Mit Zitat antworten Zitat
Mark90
(Gast)

n/a Beiträge
 
#13

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:09
Zitat von marabu:
Hallo,

mit der Indy HTTP-Client-Komponente kannst du dir eine Datei per HTTP vom Server holen. Dann brauchst du einen Parser, der dir den komfortablen Zugriff auf ein HTML-Dokument gestattet und da bietet sich MSHTML an, weil es auf jedem PC vorhanden ist. Wenn du jetzt den per HTTP geholten Seitenquelltext z.B. mit der Funktion GetDocument() in ein IHTMLDocument lädst, dann kannst du mit ExtractLinks() alle Verweise in eine StringList übertragen.

Freundliche Grüße
Noch ne kleine frage: in welcher unit befindet sich GetDocument?
  Mit Zitat antworten Zitat
Klaus01

Registriert seit: 30. Nov 2005
Ort: München
5.771 Beiträge
 
Delphi 10.4 Sydney
 
#14

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:16
Hast Du die den Link zu GetDocument angeschaut, dort ist sie zu finden.

Grüße
Klaus
Klaus
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#15

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:20
Hallo,

damit du auf CoHtmlDocument und die anderen verwendeten Schnittstellen zugreifen kannst, musst du noch Mshtml in deine Uses-Klausel einbinden.


@Catbytes: Gibt es einen funktionierenden Windows-PC ohne Mshtml.dll? Der Explorer ist abhängig von Shdocvw.dll und diese Bibliothek baut auf Mshtml.dll auf. Weißt du das nicht oder willst du mir nur eine Lektion in Sophistik erteilen?

Freundliche Grüße
  Mit Zitat antworten Zitat
Mark90
(Gast)

n/a Beiträge
 
#16

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:29
das hab ich gemacht jedoch meldet delphi bei GetDocument() undeclared identifier! hier mein code

Delphi-Quellcode:
....

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, Mshtml, StdCtrls, IdBaseComponent, IdComponent, IdTCPConnection,
  IdTCPClient, IdHTTP;

type
  TForm1 = class(TForm)
    IdHTTP1: TIdHTTP;
    Button1: TButton;
    EdURL: TEdit;
    procedure Button1Click(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}
procedure ExtractLinks(doc: IHTMLDocument2; s: TStrings; SearchString: String);
var
  ec: IHTMLElementCollection;
  e: IHTMLElement;
  i: integer;
  url: Variant;
begin
  ec := doc.links;
  for i := 0 to Pred(ec.length) do
  begin
    e := ec.item(i, 0) as IHTMLElement;
    url := VarToStr(e.getAttribute(SearchString, 0));
    if url <> 'then
      s.Add(url);
  end;
end;
procedure TForm1.Button1Click(Sender: TObject);
var
  docd: IDispatch;
  doc: IHTMLDOCUMENT2;
  url: String;
begin
  url := EdUrl.Text;
  docd := GetDocument(IdHttp1.Get(url));

end;
  Mit Zitat antworten Zitat
Klaus01

Registriert seit: 30. Nov 2005
Ort: München
5.771 Beiträge
 
Delphi 10.4 Sydney
 
#17

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:36
Delphi-Quellcode:
function GetDocument(const markup: WideString): IDispatch;
var
  doc: OleVariant;
begin
  Result := CoHtmlDocument.Create;
  doc := Result;
  doc.Open;
  doc.Write(markup);
  doc.Close;
end;
und war hier zu finden.
Und diesen Hinweis hat marabu noch dazu geschrieben:

Zitat von marabu:
Dabei darfst du nicht vergessen die Units ActiveX und Mshtml einzubinden.
Grüße
Klaus
Klaus
  Mit Zitat antworten Zitat
Mark90
(Gast)

n/a Beiträge
 
#18

Re: Website durchsuchen

  Alt 25. Aug 2007, 15:43
ich hab sie eingebunden aber es kommt immer noch eine fehlermeldung: Undeclared identifier

hier mein code:
Delphi-Quellcode:
unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs,Mshtml;

type
  TForm1 = class(TForm)
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

procedure TForm1.FormCreate(Sender: TObject);
begin
  GetDocument('xyz');
end;

end.
  Mit Zitat antworten Zitat
Klaus01

Registriert seit: 30. Nov 2005
Ort: München
5.771 Beiträge
 
Delphi 10.4 Sydney
 
#19

Re: Website durchsuchen

  Alt 25. Aug 2007, 16:27
Kommt die Fahlermeldung so auch immer noch ?
Grüße
Klaus
Delphi-Quellcode:
unit Unit1;

interface

uses
  Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
  Dialogs, ActiveX, Mshtml;

type
  TForm1 = class(TForm)
    procedure FormCreate(Sender: TObject);
  private
    { Private declarations }
  public
    { Public declarations }
  end;

var
  Form1: TForm1;

implementation

{$R *.dfm}

function GetDocument(const markup: WideString): IDispatch;
var
  doc: OleVariant;
begin
  Result := CoHtmlDocument.Create;
  doc := Result;
  doc.Open;
  doc.Write(markup);
  doc.Close;
end;

procedure TForm1.FormCreate(Sender: TObject);
begin
  GetDocument('xyz');
end;

end.
Klaus
  Mit Zitat antworten Zitat
Mark90
(Gast)

n/a Beiträge
 
#20

Re: Website durchsuchen

  Alt 25. Aug 2007, 17:31
@klaus es kommt keine meldung mehr!! mein fehler war auf die 2. seite dieses threads zu wechseln
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 3     12 3      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 20:32 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz