AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Netzwerke Delphi Wort ausschneiden aus HTML-Code (IdHTTP.Get)
Thema durchsuchen
Ansicht
Themen-Optionen

Wort ausschneiden aus HTML-Code (IdHTTP.Get)

Ein Thema von ghostdawg · begonnen am 11. Nov 2005 · letzter Beitrag vom 13. Nov 2005
Antwort Antwort
Seite 1 von 2  1 2      
ghostdawg
(Gast)

n/a Beiträge
 
#1

Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 19:49
Ich schreibe an einem Proggi, was wenn man einen Filmnamen eingibt die imdb-URL zum Film ausgeben soll.
imdb-urls sind immer wie folgt aufgebaut:
http://www.imdb.com/title/tt[nummer]

So weit bin ich aber ich komme nicht mehr weiter:
url:=idHTTP1.Get('http://www.imdb.com/find?q='+filmname+';s=tt');
Damit macht er eine Suchanfrage, also öffnet die seite wo ein Link zum tatsächlichen imdb-Film direkt drin steht.

Nun ist der string url ja ein ewig langer html quelltext.

Da dachte ich ich könnte so das entscheidende, nämlich die nummer nach tt (siehe oben) rausschneiden:
delete(url,1,pos('a href="/title/',url)-14);

Damit erhoffte ich mir dass url jetzt so aussieht:
tt[nummer]">Text</a>...[ganz viel html code]...</html>

Dann wollte ich mit
copy(url,1,pos('">',url));

Zu dem Ergebnis kommen, dass url so aussähe:
tt[nummer]

Leider scheint das pos nicht so wirklich zu funktionieren, pos ist immer 0. Außerdem bin ich mir nicht über den weiteren verlauf sicher und ob die syntax mit copy und delete so funktioniert. Ich hoffe es kann mir jemand weiterhelfen, habe nicht so viel erfahrung mit delphi.
danke im vorraus, ghostdawg
  Mit Zitat antworten Zitat
BenjaminH

Registriert seit: 14. Okt 2004
Ort: Freiburg im Breisgau
713 Beiträge
 
Turbo Delphi für Win32
 
#2

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 19:58
Ich möchte dich nur mal daran erinnern, dass man nicht auf die Imdb zugreifen darf, wenn man da nicht bezahlt..
Weil ich davon ausgehe, dass du das nicht tust, wäre das illegal.
Und somit hier in der DP nicht erwünscht.

Schönes Wochenende Benjamin
Benjamin
  Mit Zitat antworten Zitat
ripper8472

Registriert seit: 17. Aug 2003
275 Beiträge
 
#3

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:10
davon abgesehen, dass es legal ist, kostenlos verfuegbare daten zu nutzen, wuerd ich dir zu einer regex library raten. dieses pos() rumgefummele bringts einfach nicht.
Christoph
char l[]="\xd6N\x96\xa6\xe6\xce.\xa6\xe4\xce\x04N\x86\xae\ xce\xfc",I,*i=l-1;for(;I=3,*i
++;){while(*i=*i&~(1<<I|1<<7-I)|(*i&1<<I)<<7-2*I|(*i&1<<7-I)>>7-2*I,I--);}puts(l);
  Mit Zitat antworten Zitat
BenjaminH

Registriert seit: 14. Okt 2004
Ort: Freiburg im Breisgau
713 Beiträge
 
Turbo Delphi für Win32
 
#4

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:17
So wie ich diesen Thread interpretiere ist das illegal!
Wenn man das aber über deren FTP Server macht ist es legal..
Benjamin
  Mit Zitat antworten Zitat
ghostdawg
(Gast)

n/a Beiträge
 
#5

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:25
Ich arbeite doch gar nicht mit deren Daten, ich will nur einen Link der zu ihrer Seite führt setzen. Ausserdem ist das prog für mich und nicht öffentlich. Ich hoffe man kann mir trotzdem damit weiterhelfen, ich wills ja auch lernen und frage hier nicht nach illegalen methoden.
  Mit Zitat antworten Zitat
Der_Unwissende

Registriert seit: 13. Dez 2003
Ort: Berlin
1.756 Beiträge
 
#6

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:28
Zitat von ripper8472:
davon abgesehen, dass es legal ist, kostenlos verfuegbare daten zu nutzen, ...
Wow, wie kommst du denn auf die Idee? Es ist durchaus etwas anderes ob Daten einem Benutzer per Website zur verfügung gestellt werden oder ob diese automatisch ausgewertet werden. Du kannst in einigen Lizenzbestimmungen (die auch in Deutschland geltendes Recht sind) nachlesen, dass je nach Kontext der Benutzung durchaus Informationen nicht genutzt werden dürfen.
Als dummes Beispiel Googles Webservices. Die stellen dir kostenlos Informationen über die häufigsten Suchbegriffe zur Verfügung. Nur wenn du daraus eine automatisierte Abfrage durchführst und diese Daten für eine Statistik (oder was anderes) benutzt, also einfach automatisiert abfragst, musst du eine bezahlte Lizenz haben. Sonst bekommst du die in einer anderen Lizenz kostenlos.

Also gerade bei solchen Fragen sollte man bloss nicht zu sehr verallgemeinern, wenn dann eher restriktiv. Kann sonst echt mal richtig teuer werden...

Gruß Der Unwissende
  Mit Zitat antworten Zitat
ghostdawg
(Gast)

n/a Beiträge
 
#7

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:31
Zitat von Der_Unwissende:
Zitat von ripper8472:
davon abgesehen, dass es legal ist, kostenlos verfuegbare daten zu nutzen, ...
Nur wenn du daraus eine automatisierte Abfrage durchführst und diese Daten für eine Statistik (oder was anderes) benutzt, also einfach automatisiert abfragst, musst du eine bezahlte Lizenz haben. Sonst bekommst du die in einer anderen Lizenz kostenlos.
http://www.google.de/apis/
1000 anfragen pro tag kostenlos.. na?

Bitte macht doch mal keinen radau. Ich benutze ja nicht mal Daten von denen, ich könnte auch bei google die url rausfiltern, das wär noch ein bisschen aufwand mehr. Schlimmstenfalls schick ich denen mal ne mail und frage ob ich für meinen privaten gebrauch ein programm bauen darf, was mir bloß den link zu ihrer seite ausgibt..
  Mit Zitat antworten Zitat
Der_Unwissende

Registriert seit: 13. Dez 2003
Ort: Berlin
1.756 Beiträge
 
#8

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:35
@ghostdawg Öffentlich oder nicht, es ist illegal und damit sind auch Tipps, die hier in der Delphi-Praxis gegeben werden durchaus bedenklich. Nicht für dich, da solltest du eigentlich weniger Sorgen haben, aber halt für die Admins. Da gibt es die lustige Deutsche Rechtsprechung darüber, wer für den Inhalt der Beiträge zuständig ist. Und da eigentlich die DP-Mitglieder mit den Admins zufrieden sind (höre keine Widersprüche ) wird (sollte) hier sicher keiner auch nur Hilfe zu diesem Problem geben.
Sorry, aber ist nichts persönliches oder so, einfach nur ein schlechtes Problem.
Ausserdem kann selbst das setzen eines Links (dann allerdings nur für dich) zu einer Abmahnung führen. Auch da gibt es Fälle wo dies ins Urteil kam. Du solltest, wenn du eine solche Idee verfolgst immer die Lizenzbedingungen der Seite lesen. Soweit diese nichts in der Art beinhaltet, gilt es per mail (oder anders) Kontakt aufzunehmen und um eine Erlaubnis zu fragen. Klingt alles ein wenig übertrieben für ein kleines privates Programm, aber glaub mir, alles andere kann durch eine Folge ungünstiger Umstände oder was auch immer teuer werden. Und im Zweifel...
  Mit Zitat antworten Zitat
ghostdawg
(Gast)

n/a Beiträge
 
#9

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 11. Nov 2005, 20:38
Ich werde dann die ganze Arbeit per hand machen, wofür ich mir das programm schreiben wollte und ihnen damit 100x soviel traffic verursachen, weil ich nicht nur html-text sondern die ganzen bilder dazu laden muss. wenns halt so ist, schade drum.

edit: kann dann geschlossen werden, tut mir leid. nächstes hol ich mir erst eine schriftliche genehmigung der seite bevor ich so etwas frage.
gruß ghostdog
  Mit Zitat antworten Zitat
Benutzerbild von fkerber
fkerber
(CodeLib-Manager)

Registriert seit: 9. Jul 2003
Ort: Ensdorf
6.723 Beiträge
 
Delphi XE Professional
 
#10

Re: Wort ausschneiden aus HTML-Code (IdHTTP.Get)

  Alt 12. Nov 2005, 00:33
Hi!

Dann siehst du aber auch die Werbung über die sich die Seite vllt. finanziert, oder nicht?


Ciao Frederic
Frederic Kerber
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 19:20 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz