AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Webseite parsen - Unterschiedliche Quelltexte
Thema durchsuchen
Ansicht
Themen-Optionen

Webseite parsen - Unterschiedliche Quelltexte

Ein Thema von Yheeky · begonnen am 23. Dez 2007 · letzter Beitrag vom 25. Dez 2007
Antwort Antwort
Yheeky

Registriert seit: 7. Jun 2002
1.339 Beiträge
 
#1

Webseite parsen - Unterschiedliche Quelltexte

  Alt 23. Dez 2007, 02:08
Hi,

folgendes: ich wollte die Webseite www.goyellow.de parsen und habe mir hierfür den Code über meinen Browser Firefox angeschaut. Wenn ich in meinem Programm nun allerdings über die Komponente IdHTTP die Seite anschaue, habe ich einen ganz anderen Quelltext. Wieso das? Wie kann ich den Text von Firefox bekommen?
Ich hoffe mir kann da jemand weiterhelfen. Danke schonmal!
  Mit Zitat antworten Zitat
Benutzerbild von cruiser
cruiser

Registriert seit: 23. Dez 2003
Ort: Königsbrück/Sachsen
455 Beiträge
 
Delphi 7 Enterprise
 
#2

Re: Webseite parsen - Unterschiedliche Quelltexte

  Alt 23. Dez 2007, 02:17
Du sendest dem Webserver bei der Anfrage den User-agent (glaube das heisst so, ist im Grunde der Browser incl. Version) mit. Darauf kann es sein, dass das Serverscript über eine Browserweiche genau den Quelltext ausgibt, der auf deinem Browser dem gewünschten Resultat am nähesten ist.

TIdHttp hat da irgendwo eine Property für... einfach einstellen und gut

Der HTTP-User-Agent Eintrag beim aktuellen Firefox ist:

Code:
Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11
  Mit Zitat antworten Zitat
Yheeky

Registriert seit: 7. Jun 2002
1.339 Beiträge
 
#3

Re: Webseite parsen - Unterschiedliche Quelltexte

  Alt 24. Dez 2007, 14:08
Hey,

also irgendwie geht das nicht. Ich finde zwar die Property aber ich bekomme immer noch nicht den gleichen Inhalt angezeigt.
Ist auch glaube ich nicht die richtige Art bei dem Problem anzusetzen, da alle User ja den gleichen Code angezeigt bekommen sollen und nicht abhängig vom Browser...gibt´s da vielleicht noch eine Möglichkeit?

Euch allen schonmal Frohe Weihnachten!
  Mit Zitat antworten Zitat
OregonGhost

Registriert seit: 8. Jun 2002
Ort: Lübeck
1.216 Beiträge
 
Delphi 3 Professional
 
#4

Re: Webseite parsen - Unterschiedliche Quelltexte

  Alt 25. Dez 2007, 15:44
Zitat von Yheeky:
da alle User ja den gleichen Code angezeigt bekommen sollen und nicht abhängig vom Browser...
Wenn man nicht browser-abhängigen Code bekommen würde, könnten eine Menge Nutzer eine Menge Webseiten gar nicht erst betrachten

Der Weg sollte eigentlich schon der richtige sein. Wobei du dich vielleicht statt mit dem Code für einen aktuellen Browser vielleicht eher mit dem Standard-Code zufrieden geben kannst - mit etwas Glück ist der einfacher. Etwas rumprobieren schadet hier nicht. Zusätzliche Änderungen können aber zum Beispiel auch Cookies bewirken (z.B. benutzerdefinierte Einstellungen) oder eventuell etwas esoterischere Browser-Tests.

Davon abgesehen: Warum willst du die Seite parsen? Willst du die Seite fernsteuern? Wenn ja, bietet sie entweder dafür eine explizite Möglichkeit an - oder sie will vielleicht nicht ferngesteuert werden.
Oregon Ghost
---
Wenn NULL besonders groß ist, ist es fast schon wie ein bisschen eins.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:18 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz