![]() |
AW: Unterseiten einer Homepage ermitteln
Schau mal hier:
![]() Der Delphi Sourcecode ist zwar etwas verkorkst, aber die Erklärungen zum "Spidering Algorithm" sind ganz nützlich. |
AW: Unterseiten einer Homepage ermitteln
Erhalte soweit alle Links, aber wie kann ich bitte erkennen ob es Links sind oder Bilder oder oder ... ?
|
AW: Unterseiten einer Homepage ermitteln
Gucken, ob es auf .html oder .jpg etc. endet.
|
AW: Unterseiten einer Homepage ermitteln
Zitat:
Liebe Grüße, Valle |
AW: Unterseiten einer Homepage ermitteln
Ich wollte gerade sagen, nicht es kann ja html, htm, php, phpX usw. ändern.
Wie genau prüfe ich den Content Header? |
AW: Unterseiten einer Homepage ermitteln
Also mit
Delphi-Quellcode:
erhalte ich folgendes
IdHTTP.Head(FHomepage);
IdHTTP.Response.RawHeaders.Text; Zitat:
Edit: ah ich seh schon ganz unten :) |
AW: Unterseiten einer Homepage ermitteln
Leider zeigt mir der Content Typ auch bei "css" Dateien "Text/Html" an.
Muss ich nun doch extra die Endung prüfen? |
AW: Unterseiten einer Homepage ermitteln
Er zeigt bei CSS "text/html" an? :gruebel:
Kannst du mir den Link mal (notfalls per PN) schicken? Liebe Grüße, Valle |
AW: Unterseiten einer Homepage ermitteln
Wenn die CSS-Datei z.B. per PHP-Script generiert/ausgeliefert wird und der Programmierer wiedermal vergessen hat den ContentType ordentlich zu setzen, dann kann sowas schonmal bei rauskommen.
PS: Das Optimalste und das, für alle Seiten, Beste wäre, wenn die Webseite direkt alle nötigen Informationen bereitstellt und man somit nix mehr großartig pauslesen und parsen muß. Wenn es sich immer un die selbe Webseite handelt, dann könnte man ja mal den Webmaster ganz lieb fragen. :angel: |
AW: Unterseiten einer Homepage ermitteln
Hallo,
wir haben eben festgestellt, dass der Server bei der CSS-Seite alles richtig macht. Es muss am Delphi-Code liegen. Indy-Experten hier? :thumb: Liebe Grüße, Valle |
Alle Zeitangaben in WEZ +1. Es ist jetzt 07:28 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz