Sorry mit dem ExtractLinks() kann ich nix anfangen...
ich hab das hier mal gestestet mit google.de
Memo_Links.Lines.Add(Copy(Memo_Quellcode.Lines[i],POS('<a href="',Memo_Quellcode.Lines[i]),PosEx('">',Memo_Quellcode.Lines[i],POS('<a href="',Memo_Quellcode.Lines[i]))));
und raus kommt das hier:
Delphi-Quellcode:
charset=UTF-8"
href="http://images.google.de/imghp?hl=de&tab=wi"
href="http://maps.google.de/maps?hl=de&tab=wl"
href="http://news.google.de/nwshp?hl=de&tab=wn"
href="http://www.google.de/prdhp?hl=de&tab=wf"
href="http://mail.google.com/mail?hl=de&tab=wm"
onclick="this.blur();gbar.tg(event);return false"
href="http://blogsearch.google.de/?hl=de&tab=wb"
href="http://books.google.de/bkshp?hl=de&tab=wp"
href="http://docs.google.com/?hl=de&tab=wo"
href="http://picasaweb.google.de/home?hl=de&tab=wq"
href="http://groups.google.de/grphp?hl=de&tab=wg"
href="http://www.google.com/calendar?hl=de&tab=wc"
href="http://www.google.de/reader?hl=de&tab=wy"
href="http://video.google.de/?hl=de&tab=wv"
href="http://www.google.de/intl/de/options/"
hl%3Dde&usg=AFQjCNEuFEstOqdyi_oJiIgrhN9DEbl2cA"
/www.google.de/&hl=de"
title="Google-Suche" value=""
type=submit value="Google-Suche"
type=submit value="Auf gut Glück!"
style="text-align:left"
type=radio name=meta value="lr=lang_de"
value="cr=countryDE"
ich meine hier sind ein paar links drin aber es findet wie man sehen kann unendlich viele leere Zeilen und auch noch anderes zeug, was keine links sind...
was noch ist, von denlinks die hier gefunden wurden, bracuhe ich das ganze OHNE href=" was muss ich noch ändern damit das nicht mit erscheint? ich meine wwenn ich noch +7 also 7 zeichen später anfange stehet zum ende noch anderes zeug da zb:
Delphi-Quellcode:
http://news.google.de/nwshp?hl=de&tab=wn">News<
http://www.google.de/prdhp?hl=de&tab=wf">Shopp
http://mail.google.com/mail?hl=de&tab=wm">Mail<
k="this.blur();gbar.tg(event);return false"><u>Me
http://blogsearch.google.de/?hl=de&tab=wb">Blogs
http://books.google.de/bkshp?hl=de&tab=wp">Büche
http://docs.google.com/?hl=de&tab=wo">Dokum
http://picasaweb.google.de/home?hl=de&tab=wq">Fotos
http://groups.google.de/grphp?hl=de&tab=wg">Group
http://www.google.com/calendar?hl=de&tab=wc">Kalen
http://www.google.de/reader?hl=de&tab=wy">Reade
also wie kann ich das umgehen, dass neben dem Link auch noch anderes drinsteht?