AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht
Thema durchsuchen
Ansicht
Themen-Optionen

ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

Ein Thema von bogdan · begonnen am 20. Mai 2019 · letzter Beitrag vom 21. Mai 2019
Antwort Antwort
Seite 1 von 2  1 2      
bogdan

Registriert seit: 15. Apr 2013
77 Beiträge
 
#1

ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 18:40
Mit IdHTTP.Get versuche ich die folgende Seite einzulesen:

https://www.immobilienscout24.de/expose/111242696

Leider fehlen im Response Text (HTML Quellcode) einige Angaben, wie zb. der Block "Kaufnebenkosten".

Hat Jemand eine Idee woran das liegen könnte?
  Mit Zitat antworten Zitat
Der schöne Günther

Registriert seit: 6. Mär 2013
6.176 Beiträge
 
Delphi 10 Seattle Enterprise
 
#2

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 18:56
Ohne es angesehen zu haben: Viele Seiten laden Content erst später per JavaScript nach. Unter anderem auch um das "Scraping" von Inhalten zu verhindern:

https://de.wikipedia.org/wiki/Screen...Verschleierung

Man kann dann natürlich einen richtigen Webbrowser nehmen, warten bis die Seite fertig aufgebaut ist und sich dann die Inhalte zusammensuchen, aber das hält auch nur bis zum nächsten Redesign der Seite.

Ich hatte mal aus Spaß versucht mir so etwas für XHamster zu bauen, aber das artet irgendwann nur noch in stupide Fleißarbeit aus...
  Mit Zitat antworten Zitat
bogdan

Registriert seit: 15. Apr 2013
77 Beiträge
 
#3

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 19:11
Hallo Günther,

ich vermute auch, dass dieser Block erst beim Laden per JavaScript angezeigt wird.

Mit TWebBrowser funktioniert das ja auch und ich kann den Quelltext 100% auslesen.
Das Problem mit dem WebBrowser ist nur, dass sich die Applikation im RAM aufbläht und dann hat man schnell eine Fehlermeldung wegen nicht ausreichendem Arbeitsspeicher.

TWebBrowser.Free funktioniert da auch nicht. Der RAM bleibt voll.

XHamster...yeaah
  Mit Zitat antworten Zitat
Der schöne Günther

Registriert seit: 6. Mär 2013
6.176 Beiträge
 
Delphi 10 Seattle Enterprise
 
#4

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 19:20
Der TWebBrowser läuft standardmäßig nur als Internet Explorer 7-Emulation, der kann heute wahrscheinlich gar nichts mehr. Hast du den schon auf IE11 gesetzt?
  Mit Zitat antworten Zitat
bogdan

Registriert seit: 15. Apr 2013
77 Beiträge
 
#5

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 19:27
Bei FormCreate rufe ich die folgende Procedure auf:

Code:
procedure SetWebbrowserMode(Mode: TIEMode; AppName: string = '');
const
  REG_KEY = 'Software\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BROWSER_EMULATION';
var
  Reg: TRegistry;
  Value: Integer;
begin
  if AppName = '' then AppName := ExtractFileName(Application.ExeName);
  Case Mode of
    iemIE7 : Value := $1B58;
    iemIE8 : Value := $1F40;
    iemIE10 : value := $2710;
    iemIE11 : Value := $2af8;
  end;
  Reg := TRegistry.Create();
  try
    Reg.RootKey := HKEY_CURRENT_USER;
    if Reg.OpenKey(REG_KEY, True) then
    begin
      Reg.WriteInteger(AppName, Value);
      Reg.CloseKey;
    end;
  finally
    Reg.Free;
    end;
end;
Mit WebBrowsers Speicherproblem hat das aber nichts zu tun.
  Mit Zitat antworten Zitat
Rollo62

Registriert seit: 15. Mär 2007
4.116 Beiträge
 
Delphi 12 Athens
 
#6

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 19:29
Vielleicht hilft dir die Phantom-Js Browser Library ?
http://techslides.com/grabbing-html-...js-or-casperjs
Die müsste man auch mit dem embedded TWebBrowser aufrufen können, und dann damit auch JS-Seiten einlesen und parsen können.
  Mit Zitat antworten Zitat
bogdan

Registriert seit: 15. Apr 2013
77 Beiträge
 
#7

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 19:36
Hallo Rollo,

danke für den Link. Schaue ich mir mal genauer an.
  Mit Zitat antworten Zitat
Schokohase
(Gast)

n/a Beiträge
 
#8

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 20. Mai 2019, 20:59
Ich will ja kein Spielverderber sein, aber die AGB für die Nutzung der über die Website www.immobilienscout24.de zugänglichen Services der Immobilien Scout GmbH sagen
Zitat:
8. Rechte an der Datenbank
8.1. ImmobilienScout24 ist Rechtsinhaber an den Inhalten der Website und der Datenbank. Sämtliche Urheber-, Marken-und sonstigen Schutzrechte an dem Datenbankwerk, der Datenbank und den hier eingestellten Inhalten, Daten und sonstigen Elementen stehen ausschließlich ImmobilienScout24 zu; etwaige Rechte des Nutzers an den von ihm eingestellten Inhalten bleiben hiervon unberührt.

8.2. Der Nutzer hat im Rahmen dieser Nutzungsbedingungen das Recht, ausschließlich unter Verwendung der von ImmobilienScout24 zur Verfügung gestellten Online-Suchmasken einzelne Datensätze auf seinem Bildschirm sichtbar zu machen und zur dauerhaften Sichtbarmachung einen Ausdruck zu fertigen. Eine automatisierte Abfrage durch Scripte, durch Umgehung der Suchmaske durch Suchsoftware oder vergleichbare Maßnahmen sind nicht gestattet.

8.3. Der Nutzer darf die durch Abfrage gewonnenen Daten weder vollständig, noch teilweise oder auszugsweise zum Aufbau einer eigenen Datenbank in jeder medialen Form und/oder für eine gewerbliche Datenverwertung oder Auskunftserteilung und/oder für eine sonstige gewerbliche Verwertung verwenden. Die Verlinkung, Integration oder sonstige Verknüpfung der Datenbank oder einzelner Elemente der Datenbank mit anderen Datenbanken oder Meta-Datenbanken ist unzulässig.
  Mit Zitat antworten Zitat
bogdan

Registriert seit: 15. Apr 2013
77 Beiträge
 
#9

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 21. Mai 2019, 07:16
Hallo Schokohase,

Immos AGB sind mir bekannt aber nicht das Thema hier.
  Mit Zitat antworten Zitat
Schokohase
(Gast)

n/a Beiträge
 
#10

AW: ImmoScout Seite mit IDHTTP vollständig einlesen funkt nicht

  Alt 21. Mai 2019, 07:20
Hallo Schokohase,

Immos AGB sind mir bekannt aber nicht das Thema hier.
Sind dir die AGBs und Nutzungsbedingungen von diesem Forum auch bekannt? Denn nach denen sind solche Fragen hier nicht gestattet.
Zitat:
Du stehst dafür ein und Du bist dafür alleine verantwortlich, dass die von Dir eingestellten Inhalte nicht gegen gesetzliche Vorschriften oder Rechte Dritter verstoßen.

Geändert von Schokohase (21. Mai 2019 um 07:22 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 03:17 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz