AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Text aus Website

Ein Thema von Kolone · begonnen am 16. Jun 2014 · letzter Beitrag vom 23. Jun 2014
Antwort Antwort
Seite 1 von 2  1 2      
Perlsau
(Gast)

n/a Beiträge
 
#1

AW: Text aus Website

  Alt 16. Jun 2014, 22:24
Danke Wie genau kann man so ein Text parsen, bzw was ist die einfachste Möglichkeit so etwas zu tun?
Genau kann und möchte ich es dir nicht sagen, denn das wäre ein fertiger Code, den du nur kopieren mußt, und dafür lieferst du zu wenig Informationen. Außerdem ist ja deine Aufgabe, den Parser zu implementieren.

Ungenau: Du mußt dich mit der Sprache HTML auseinandersetzen und, nachdem du das kapiert hast, den Text aus dem HTML-Text auslesen. Wenn du auch nicht weißt, wie man Teilstrings in einem String findet, dann solltest du vielleicht erst einmal Grundlagen erlernen. Wenn dir das zuviel ist, dann kann dir nicht geholfen werden.
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#2

AW: Text aus Website

  Alt 16. Jun 2014, 23:15
Es gibt auch schon Antworten hier im Forum

http://www.delphipraxis.net/88200-ht...-einlesen.html
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.341 Beiträge
 
Delphi 12 Athens
 
#3

AW: Text aus Website

  Alt 16. Jun 2014, 23:19
Wenn dir das zuviel ist, dann kann dir nicht geholfen werden.
Es gibt hier und anderswo eine Abteilung, da kann man sich Programme gegen entsprechende Vergütung schreiben lassen
oder sich eine private Schulung kaufen.

Oder man nimmt seine weiteren (Teil)Fragen, geht damit in die Forensuche und sucht die vorhandenen Anworten raus,
oder fragt geziehlt, falls es noch keine Antwort gibt.
Ein Therapeut entspricht 1024 Gigapeut.

Geändert von himitsu (16. Jun 2014 um 23:21 Uhr)
  Mit Zitat antworten Zitat
Kolone

Registriert seit: 27. Jan 2013
57 Beiträge
 
#4

AW: Text aus Website

  Alt 19. Jun 2014, 11:18
Gut, wenn man keine Hilfe hier bekommt...
-.-
  Mit Zitat antworten Zitat
Perlsau
(Gast)

n/a Beiträge
 
#5

AW: Text aus Website

  Alt 19. Jun 2014, 12:28
Was hast du denn bereits unternommen, um die gewünschte HTML-Seite auszulesen?
  Mit Zitat antworten Zitat
Kolone

Registriert seit: 27. Jan 2013
57 Beiträge
 
#6

AW: Text aus Website

  Alt 20. Jun 2014, 09:57
Ich habe ein IDHttp Komponent genommen und eine Memo, die später nicht sichbar ist. Ich weiß das ist nicht grade die Meisterlösung. Der Text der Memo ist der Quellcode der Website. Mit Pos habe ich dann versucht den HTML Befehl zu finden und somit das zu löschen was die Befehlszeilen von HTML sind, sodass nur noch der String übrigbleibt. Das ist leider nicht so die hervorragende Lösung und deswegen wollte ich wissen, ob es eine Komponente schon gibt, die eben das schon macht oder ob die IDhttp Komponente den Befehl hat nur die Strings einer HTML Seite auszulesen.
  Mit Zitat antworten Zitat
Kolone

Registriert seit: 27. Jan 2013
57 Beiträge
 
#7

AW: Text aus Website

  Alt 20. Jun 2014, 10:00
Es ist außerdem ziemlich blöd, weil im HTML Code öfters mehrmals doppelte Befehle auftauchen
  Mit Zitat antworten Zitat
Benutzerbild von Puke
Puke

Registriert seit: 7. Nov 2012
123 Beiträge
 
Delphi XE5 Architect
 
#8

AW: Text aus Website

  Alt 20. Jun 2014, 10:04
Versuche es mal mit Delphi-Referenz durchsuchenStringReplace
Gruß Puke
  Mit Zitat antworten Zitat
Benutzerbild von p80286
p80286

Registriert seit: 28. Apr 2008
Ort: Stolberg (Rhl)
6.659 Beiträge
 
FreePascal / Lazarus
 
#9

AW: Text aus Website

  Alt 20. Jun 2014, 10:37
Es ist außerdem ziemlich blöd, weil im HTML Code öfters mehrmals doppelte Befehle auftauchen
??? Mir scheint Du hast dich noch nicht alzu oft mit HTML auseinander gesetzt.

Der erste Schritt sollte sein, die Stellen, die sich ändern, bzw. ändern könnten (sofern Du es weißt) zu identifizieren.

Dann such Dir eine markante Markierung dann hast Du Futter für Dein pos .

Eine andere Möglichkeit wäre alles zwischen '<' und '>' zu löschen, dann sollte nur noch der nackte Text übrig bleiben. Was allerdings in den allermeisten Fällen, nur noch Bedeutungshack übrig läßt.

U.U. findest Du hier noch ein paar Infos, die Dir weiterhelfen.

Gruß
K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector
  Mit Zitat antworten Zitat
Perlsau
(Gast)

n/a Beiträge
 
#10

AW: Text aus Website

  Alt 20. Jun 2014, 16:46
Ich habe ein IDHttp Komponent genommen und eine Memo, die später nicht sichbar ist. ... Der Text der Memo ist der Quellcode der Website.
Da nimmt man besser eine Stringliste, da du das Memo ja sowieso nicht anzeigen lassen möchtest.

Mit Pos habe ich dann versucht den HTML Befehl zu finden und somit das zu löschen was die Befehlszeilen von HTML sind, sodass nur noch der String übrigbleibt.
Versucht hießt soviel wie mißlungen? Könntest du dich vielleicht ein wenig deutlicher ausdrücken? Am besten, du zeigst hier einmal, was du gemacht hast, und erklärst, was dabei herauskommt bzw. welche Fehlermeldungen erscheinen.

Das ist leider nicht so die hervorragende Lösung und deswegen wollte ich wissen, ob es eine Komponente schon gibt, die eben das schon macht oder ob die IDhttp Komponente den Befehl hat nur die Strings einer HTML Seite auszulesen.
Es gibt sog. HTML-Parser, aber die sind auch nicht leichter zu bedienen als das Delphi-Bordwerkzeug. Die meisten Freeware-Parser, die ich schon ausprobiert hatte, waren buggy, und die guten kosten wohl eine Stange Geld, denn so ein HTML-Parser ist kein Kinderspiel.

Was meinst du mit "nur die Strings einer HTML Seite"?

Eine fertige Komponente, die dir genau das heraussucht, was du benötigst, gibt es meines Wissens nach nicht. Da mußt du schon selber Hand anlegen.

Hast du dich denn inzwischen ein wenig mit der Sprache und der Syntax von HTML befaßt?

Hast du inzwischen einmal den Link von Sir Rufo studiert, der auf eine ähnliche Anfrage hier im Forum verweist?

Es ist außerdem ziemlich blöd, weil im HTML Code öfters mehrmals doppelte Befehle auftauchen
In deinem Programm kommen doch auch einige Befehle öfter vor, oder etwa nicht? HTML-Code ist auch nichts anderes als ein Programmcode. Was soll daran blöd sein? Welche Schwierigkeiten hast du konkret damit?

Weiter oben hattest du geschrieben:
Gut, wenn man keine Hilfe hier bekommt...
Wenn du dich weiterhin so unkooperativ zeigst und auf hilfreiche Beiträge nicht eingehst bzw. die angebotene Hilfe nicht annimmst, kann dir leider nicht geholfen werden – außer es findet sich einer, der dir deinen Code hier reinschreibt, was eher unwahrscheinlich ist, denn man weiß ja so gut wie nichts darüber, was du eigentlich genau machen möchtest, nicht einmal die URL zu der Seite, die du auszulesen gedenkst.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      

 

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 15:30 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz