AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Unterseiten einer Homepage ermitteln
Thema durchsuchen
Ansicht
Themen-Optionen

Unterseiten einer Homepage ermitteln

Ein Thema von youuu · begonnen am 21. Sep 2010 · letzter Beitrag vom 22. Sep 2010
Antwort Antwort
Seite 2 von 3     12 3      
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#11

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 17:37
Schau mal hier:
Felix colibri Web Spider
Der Delphi Sourcecode ist zwar etwas verkorkst, aber die Erklärungen zum "Spidering Algorithm" sind ganz nützlich.
Andreas
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#12

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 20:53
Erhalte soweit alle Links, aber wie kann ich bitte erkennen ob es Links sind oder Bilder oder oder ... ?
Steven
  Mit Zitat antworten Zitat
Benutzerbild von Die Muhkuh
Die Muhkuh

Registriert seit: 21. Aug 2003
7.332 Beiträge
 
Delphi 2009 Professional
 
#13

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 20:56
Gucken, ob es auf .html oder .jpg etc. endet.
  Mit Zitat antworten Zitat
Benutzerbild von Valle
Valle

Registriert seit: 26. Dez 2005
Ort: Karlsruhe
1.223 Beiträge
 
#14

AW: Unterseiten einer Homepage ermitteln

  Alt 21. Sep 2010, 21:27
Gucken, ob es auf .html oder .jpg etc. endet.
Nein. Dem vom Server gesendeten Content-Type-Header auswerten.

Liebe Grüße,
Valle
Valentin Voigt
BOFH excuse #423: „It's not RFC-822 compliant.“
Mein total langweiliger Blog
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#15

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 07:56
Ich wollte gerade sagen, nicht es kann ja html, htm, php, phpX usw. ändern.
Wie genau prüfe ich den Content Header?
Steven
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#16

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 08:04
Also mit

Delphi-Quellcode:
IdHTTP.Head(FHomepage);
IdHTTP.Response.RawHeaders.Text;
erhalte ich folgendes

Zitat:
Date: Wed, 22 Sep 2010 06:03:08 GMT
Server: Apache
X-Powered-By: PHP/5.2.12-nmm2
Set-Cookie: cookieHash=4cbf1ca3f8bf102c9170f6bde3bb1377687a070 2; expires=Fri, 22-Oct-2010 06:03:08 GMT
Set-Cookie: PHPSESSID=421317f10bff0a87b5c58f359bc04f82b04da899 ; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Vary: Accept-Encoding
Content-Type: text/html; charset='UTF-8'

Edit: ah ich seh schon ganz unten
Steven

Geändert von youuu (22. Sep 2010 um 08:10 Uhr)
  Mit Zitat antworten Zitat
youuu

Registriert seit: 2. Sep 2008
Ort: Kleve
822 Beiträge
 
Delphi 2010 Professional
 
#17

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 08:22
Leider zeigt mir der Content Typ auch bei "css" Dateien "Text/Html" an.

Muss ich nun doch extra die Endung prüfen?
Steven
  Mit Zitat antworten Zitat
Benutzerbild von Valle
Valle

Registriert seit: 26. Dez 2005
Ort: Karlsruhe
1.223 Beiträge
 
#18

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 09:45
Er zeigt bei CSS "text/html" an?
Kannst du mir den Link mal (notfalls per PN) schicken?

Liebe Grüße,
Valle
Valentin Voigt
BOFH excuse #423: „It's not RFC-822 compliant.“
Mein total langweiliger Blog
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.184 Beiträge
 
Delphi 12 Athens
 
#19

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 09:51
Wenn die CSS-Datei z.B. per PHP-Script generiert/ausgeliefert wird und der Programmierer wiedermal vergessen hat den ContentType ordentlich zu setzen, dann kann sowas schonmal bei rauskommen.


PS: Das Optimalste und das, für alle Seiten, Beste wäre,
wenn die Webseite direkt alle nötigen Informationen bereitstellt und man somit nix mehr großartig pauslesen und parsen muß.
Wenn es sich immer un die selbe Webseite handelt, dann könnte man ja mal den Webmaster ganz lieb fragen.
$2B or not $2B

Geändert von himitsu (22. Sep 2010 um 09:54 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Valle
Valle

Registriert seit: 26. Dez 2005
Ort: Karlsruhe
1.223 Beiträge
 
#20

AW: Unterseiten einer Homepage ermitteln

  Alt 22. Sep 2010, 09:56
Hallo,

wir haben eben festgestellt, dass der Server bei der CSS-Seite alles richtig macht.
Es muss am Delphi-Code liegen. Indy-Experten hier?

Liebe Grüße,
Valle
Valentin Voigt
BOFH excuse #423: „It's not RFC-822 compliant.“
Mein total langweiliger Blog
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 3     12 3      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:52 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz