so erstmal hier mein aktueller code:
Delphi-Quellcode:
procedure TForm1.BtnSearchSitClick(Sender: TObject);
var direct,filename:
string;
page:TStringList;
i,j,idx:integer;
re:TRegExpr;
such:Boolean;
begin
direct:=Edpaths.Text;
//GetFilesInDirectory(direct,'*.html',LiBoSit.Items,true,true);
GetFilesInDirectory(direct,'
*.htmlm',LiBoSit.Items,true,false);
//GetFilesInDirectory(direct,'*.jsp',LiBoSit.Items,true,false);
LbSit.Caption:=(IntToStr(LiBoSit.Count));
//routine zum suchen der Url in den htmls
page:=TStringList.Create;
re:=TRegExpr.Create;
try
for i:=0
to LiBoSit.Count-1
do
begin
page.LoadFromFile(LiBoSit.Items[i]);
re.ModifierI:=true;
re.ModifierG:=false;
re.ModifierM:=false;
re.ModifierS:=false;
re.ModifierX:=false;
re.Expression:='
img .*?src=[\\]??"([^"]*)[\\]??';
such:=re.Exec(page.Text);
if such
then
repeat
idx:=LastPos('
/',re.match[1]);
if idx > 0
then filename:=copy(re.Match[1],idx+1,length(re.Match[1]))
else filename:=re.match[1];
LiBoPicsFoundInPages.Items.Add(filename);
Label12.Caption:=re.Match[1];
until not re.ExecNext;
end;
finally
page.Free;
re.Free;
end;
LbPicsFoundInPages.Caption:=(IntToStr(LiBoPicsFoundInPages.Count));
end;
bei diesen RegAus hab ich nun das problem das er zwar sucht (das sehe ich an dem scrollbalken der in der listbox erscheint), die listbox an sich aber leider leer bleibt und ich mit ihr nicht weiterarbeiten kann.
das hier ist der code einer htmlm-datei:
Code:
document.write("\n"+
"\n"+
"\n"+
"\n"+
" \n"+
"\n"+
" \n"+
"\n"+
"\n"+
" \n"+
" <table border=\"0\" cellpadding=\"0\" cellspacing=\"0\" summary=\"summär€\" width=\"100%\">\n"+
" <tr>\n"+
" <td valign=\"top\"><a href=\"http:\/\/freizeichentoene.t-mobile.at\/index\" title=\"Alexander Rybak - Fairytales\"><img alt=\"Alexander Rybak - Fairytales\" border=\"0\" src=\"\/at\/app_pic\/modules\/right\/Freizeichenton_der_Woche_Alexander%20Rybak-Fairytales.jpg\" \/><\/a><\/td>\n"+
" <\/tr>\n"+
" \n"+
" <\/table>\n"+
" \n"+
"\n"+
"\n"+
"\n"+
"\n"+
"\n"+
"\n"+
"\n"+
"\n"+
"\n"+
"");
aus ihr moechte ich "Freizeichenton_der_Woche_Alexander Rybak-Fairytales.jpg" als beispiel rausfiltern