![]() |
Regex: zwischen 2 Strings "matchen"
Hi,
Also bei dieser Frage geht es zwar nicht direkt um Delphi, aber ich glaube hier sind auch genug Leute, die sich ganz gut mit regulären Ausdrücken auskennen und mir das beantworten können. Als Beispiel habe ich z.B. diesen String/Text:
Code:
Nun würde ich daraus gerne die 3 Links zwischen bla und blub "matchen" (z.B. mit einem Aufruf von Regex.Matches in Delphi).
bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
irgendwas... <a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a> ... Da ich nur die 3 Links zwischen bla und blub haben möchte, kann ich hier ja nicht einfach einen allgemeinen Link "matchen", da sonst die 3 Links weiter unten auch "gematcht" würden. Ich könnte jetzt natürlich zuerst den Text zwischen bla und blub "matchen" und dann in diesem nach den Links suchen, das möchte ich aber nicht. Daher meine Frage: Geht das auch mit nur einem Matches-Aufruf? Ich hoffe, das war halbwegs verständlich... :stupid: MfG |
AW: Regex: zwischen 2 Strings "matchen"
Mal so grundsätzlich:
HTML bzw. XML mit Regular Expression auszuwerten ist keine gute Idee. Weiterer Lesestoff (englisch): ![]() |
AW: Regex: zwischen 2 Strings "matchen"
Ja, das kann gut sein, das war hier auch nur ein Beispiel... :stupid:
Ich wollte halt nur wissen, ob und wie das möglich ist. Ich mein, reguläre Ausdrücke sind doch eigentlich recht "mächtig", das muss dafür doch eine Möglichkeit geben, ein Stichwort zum Googeln würde reichen... |
AW: Regex: zwischen 2 Strings "matchen"
Code:
/bla.*((hierdasregexeineslinks).*)?.*blub/
|
AW: Regex: zwischen 2 Strings "matchen"
Danke himitsu, das sieht schon ganz gut aus, es kommen schon 3 Treffer zurück, aber das Resultat sieht so aus (PHP):
Code:
Und es soll ja so aussehen:
Array
( [0] => Array ( [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub ) [1] => Array ( [0] => ) [2] => Array ( [0] => ) )
Code:
Array
( [0] => Array ( [0] => <a href="#">a</a> ) [1] => Array ( [0] => <a href="#">b</a> ) [2] => Array ( [0] => <a href="#">c</a> ) ) |
AW: Regex: zwischen 2 Strings "matchen"
Die zweite Klammer (um das hierdasregexeineslinks) hast du im Code dringelassen?
|
AW: Regex: zwischen 2 Strings "matchen"
Am Ende müßte irgendwie sowas rauskommen.
Code:
oder
Array
( [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub [1] => <a href="#">a</a> [2] => <a href="#">b</a> [3] => <a href="#">c</a> )
Code:
[0] = der gesamte gefundene Text
Array
( [0] => Array ( [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub [1] => <a href="#">a</a> [2] => <a href="#">b</a> [3] => <a href="#">c</a> ) ) Nachfolgendes = die ganzen Referenzen So wie es aussieht, läßt du dir sie subreferenzen nicht mit ausgeben. :zwinker: |
AW: Regex: zwischen 2 Strings "matchen"
Die Klammern sind drin, so habe ich es getestet:
Code:
if(preg_match_all('@bla.*((<a href="#">[a-z]</a>).*)?.*blub@',file_get_contents('a.txt'),$m)) print_r($m);
Zitat:
|
AW: Regex: zwischen 2 Strings "matchen"
versuch mal PREG_SET_ORDER oder PREG_PATTERN_ORDER, bzw. PREG_SET_ORDER|PREG_PATTERN_ORDER
|
AW: Regex: zwischen 2 Strings "matchen"
Hilft leider auch nicht :(
PREG_PATTERN_ORDER
Code:
PREG_SET_ORDER
Array
( [0] => Array ( [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub ) [1] => Array ( [0] => ) [2] => Array ( [0] => ) )
Code:
PREG_SET_ORDER | PREG_PATTERN_ORDER
Array
( [0] => Array ( [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub ) ) Gibt die Meldung "Invalid flags specified". |
AW: Regex: zwischen 2 Strings "matchen"
Eigentlich müßte es doch so gehn?
Code:
aber aus irgendeinem Grund geht es nicht :gruebel.
@(?<=bla.*)(<a href="#">([a-z]*)</a>)(?=.*blub)@U
aber diese gehn, allerdings finden sie nur das erste und fangen dann mit der suche erst wieder nach dem blub an
Code:
Wobei das .* bei bla noch so geändert werden sollte/könnte, daß dort kein blub drin vorkommt
@(?<=bla).*(<a href="#">([a-z]*)</a>).*(?=blub)@U
@(?<=bla)(.*<a href="#">([a-z]*)</a>.*)(?=blub)@U und in .* bei blub kein bla. |
AW: Regex: zwischen 2 Strings "matchen"
Aaah. :wall:
HTML mit RegEx parsen ist doch einfach nur Gemurkse. Das ist dann genau der Code, der bei einer kleinen Änderung der Aussenwelt nicht mehr funktioniert und dann fängt das grosse Debuggen an. Wozu gibt es denn in PHP das Document Object Model? DOMDocument->loadHTML() aufrufen und damit weiterarbeiten. Kleines Startbeispiel:
PHP-Quellcode:
$doc = new DOMDocument();
$doc->loadHTML($myhtml); $tags = $doc->getElementsByTagName('a'); foreach ($tags as $tag) { echo $tag->getAttribute('href').' | '.$tag->nodeValue."\n"; } |
AW: Regex: zwischen 2 Strings "matchen"
Ich werde es dann wohl doch über den Umweg lösen, es scheint wohl doch recht kompliziert zu sein...
Danke jedenfalls für die Hilfe, himitsu, auch wenn ich deine Ausdrücke noch nicht so recht verstanden habe :lol: |
AW: Regex: zwischen 2 Strings "matchen"
Look-Ahead und Look-Behind (zusammen Look-Around) werden zwar gesucht, aber nicht in das Suchergebnis aufgenommen.
Es gibt da auch noch Negative-Look-Ahead und Negative-Look-Behind, welche prüfen, ob etwas nicht vorkommt. Somit können auf diese Weise die Suchmuster sich teilweise überlappen und werden von preg_match_all dennoch gefunden. In diesem Fall könnten bla und blub in mehreren Suchergebnissen vorkommen, da nur der jeweilige Link in den Ergnissen vorkommt. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 14:50 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz