AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Unterseiten einer Homepage ermitteln
Thema durchsuchen
Ansicht
Themen-Optionen

Unterseiten einer Homepage ermitteln

Ein Thema von youuu · begonnen am 21. Sep 2010 · letzter Beitrag vom 22. Sep 2010
Antwort Antwort
Seite 1 von 3  1 23      
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#1

Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 14:48
Hi,

wie kann ich alle Unterseiten einer Homepage ermitteln?
Das heißt, das ich keine externen Verlinkungen mit aufsammeln möchte.

Unterseiten können auch relative Pfade enthalten.
Steven
  Mit Zitat antworten Zitat
Namenloser

Registriert seit: 7. Jun 2006
Ort: Karlsruhe
3.724 Beiträge
 
FreePascal / Lazarus
 
#2

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 14:57
Wie hast du es bisher versucht?
  Mit Zitat antworten Zitat
Benutzerbild von Luckie
Luckie

Registriert seit: 29. Mai 2002
37.621 Beiträge
 
Delphi 2006 Professional
 
#3

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 14:59
Allen Links folgen und wenn ein Link eine fremde Domain beinhaltet, dann gehört die Seite nicht zur Seite.
Michael
Ein Teil meines Codes würde euch verunsichern.
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#4

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:06
Ich hätte es jetzt umständlich gemacht mit:

1. idhttp.get
2. per "Pos", "Copy" alle Links gesucht
3. aussortieren der links die auf eine andere homepage führen
4. die relativen Pfade umgeschrieben.

Ich dachte nur es geht vielleicht einfacher.
Steven
  Mit Zitat antworten Zitat
Benutzerbild von rollstuhlfahrer
rollstuhlfahrer

Registriert seit: 1. Aug 2007
Ort: Ludwigshafen am Rhein
1.529 Beiträge
 
Delphi 7 Professional
 
#5

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:26
ja, einfacher geht es mit einem Sitemap, vor allem das, was von Google abgefragt wird. Nur gibt es keine definierte Stelle, wo das Sitemap liegt.

Bernhard

PS: Allen Links folgen ist nun einfach die einzige Lösung, wenn man nicht über "Hintertüren" an mehr Informationen kommt.
Bernhard
Iliacos intra muros peccatur et extra!
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#6

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:33
Naja, ich kann nicht davon ausgehen, das die Seiten alle eine Sitemap besitzen und diese alle in einen einhetlichen Format angegeben sind.
Da existeren ja doch ei paar mehr Varianten.
Steven
  Mit Zitat antworten Zitat
Benutzerbild von rollstuhlfahrer
rollstuhlfahrer

Registriert seit: 1. Aug 2007
Ort: Ludwigshafen am Rhein
1.529 Beiträge
 
Delphi 7 Professional
 
#7

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:37
ja genau deswegen wirst du nicht drum herum kommen, allen Links zu folgen.

Bernhard
Bernhard
Iliacos intra muros peccatur et extra!
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#8

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:43
Ok, dann mach ich mich mal daran.
Danke
Steven
  Mit Zitat antworten Zitat
Benutzerbild von Bummi
Bummi

Registriert seit: 15. Jun 2010
Ort: Augsburg Bayern Süddeutschland
3.470 Beiträge
 
Delphi XE3 Enterprise
 
#9

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 15:44
vielleich hilft Dir der Codefetzen aus unserer Codebase?
Delphi-Quellcode:
procedure TCrawlingThread.WBDocumentComplete(Sender: TObject ;const pDisp:IDispatch;var URL: OLEVariant);
var
  i:Integer;
  ElementCollection: IHTMLElementCollection;
  HtmlElement: IHTMLElement;
  AnchorString: string;
  sl:TStringList;
begin
  try
  if Assigned((FWB.Document as IHTMLDocument2).body) then
    begin
      sl:=TStringList.Create;
      try
      sl.Text := ((FWB.Document as IHTMLDocument2).body as IHTMLBodyElement).createTextRange.text;
      sl.SaveToFile(IncludeTrailingBackSlash(FFilePath) + FGuid);
      finally
      sl.Free;
      end;
    end;
  ElementCollection:= (FWB.Document as IHTMLDocument2).all;
  For i := 0 To ElementCollection.length - 1 do
      begin
            HtmlElement := ElementCollection.item(I, '') as IHTMLElement;
            if HTMLElement.tagName = 'Athen
            begin
              AnchorString := (HtmlElement as IHTMLAnchorElement).href;
              FCollectedLinks.Add(AnsiLowerCase(AnchorString));
              end;
      end;
  FCanTerminate := true;

  except
  on E:Exception do FError := E.Message;
  end;
end;
Thomas Wassermann H₂♂
Das Problem steckt meistens zwischen den Ohren
DRY DRY KISS
H₂ (wenn bei meinen Snipplets nichts anderes angegeben ist Lizenz: WTFPL)
  Mit Zitat antworten Zitat
Benutzerbild von Die Muhkuh
Die Muhkuh

Registriert seit: 21. Aug 2003
7.332 Beiträge
 
Delphi 2009 Professional
 
#10

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 17:08
Lustig wird's dann bei Flash-Seiten oder welche, die den Content per JavaScript nachladen und diesen auch nur per JS austauschen.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 3  1 23      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 11:03 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz