![]() |
TRegExp und URLs
Hallo,
ich hab ein kleines Problem mit TRegExp. Ich will aus einem String alle URLs auslesen und mache das bisher mit folgendem regulärem Ausdruck (aus der Demo bei TRegExp):
Delphi-Quellcode:
Nun kommt es aber vor, dass URLs dabei sind, die dieses Format haben:
URLTemplate =
'(?i)' + '(' + '(FTP|HTTP)://' // Protocol + '|www\.)' // trick to catch links without // protocol - by detecting of starting 'www.' + '([\w\d\-]+(\.[\w\d\-]+)+)' // TCP addr or domain name + '(:\d\d?\d?\d?\d?)?' // port number + '(((/[%+\w\d\-\\\.]*)+)*)' // unix path + '(\?[^\s=&]+=[^\s=&]+(&[^\s=&]+=[^\s=&]+)*)?' // request (GET) params + '(#[\w\d\-%+]+)?'; // bookmark Zitat:
URLs zu erfassen? (Ich denke mal, es liegt an den geschweiften Klammern und/oder den Leerzeichen!) Viele Grüße, Delphi-Coder |
Alle Zeitangaben in WEZ +1. Es ist jetzt 02:10 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz