Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Regex: zwischen 2 Strings "matchen" (https://www.delphipraxis.net/160306-regex-zwischen-2-strings-matchen.html)

luke2 6. Mai 2011 14:05

Regex: zwischen 2 Strings "matchen"
 
Hi,

Also bei dieser Frage geht es zwar nicht direkt um Delphi, aber ich glaube hier sind auch genug Leute, die sich ganz gut mit regulären Ausdrücken auskennen und mir das beantworten können.

Als Beispiel habe ich z.B. diesen String/Text:
Code:
bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
irgendwas...
<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>
...
Nun würde ich daraus gerne die 3 Links zwischen bla und blub "matchen" (z.B. mit einem Aufruf von Regex.Matches in Delphi).
Da ich nur die 3 Links zwischen bla und blub haben möchte, kann ich hier ja nicht einfach einen allgemeinen Link "matchen", da sonst die 3 Links weiter unten auch "gematcht" würden.

Ich könnte jetzt natürlich zuerst den Text zwischen bla und blub "matchen" und dann in diesem nach den Links suchen, das möchte ich aber nicht.

Daher meine Frage: Geht das auch mit nur einem Matches-Aufruf?

Ich hoffe, das war halbwegs verständlich... :stupid:

MfG

shmia 6. Mai 2011 14:11

AW: Regex: zwischen 2 Strings "matchen"
 
Mal so grundsätzlich:
HTML bzw. XML mit Regular Expression auszuwerten ist keine gute Idee.
Weiterer Lesestoff (englisch): http://www.codinghorror.com/blog/200...hulhu-way.html

luke2 6. Mai 2011 14:20

AW: Regex: zwischen 2 Strings "matchen"
 
Ja, das kann gut sein, das war hier auch nur ein Beispiel... :stupid:

Ich wollte halt nur wissen, ob und wie das möglich ist.
Ich mein, reguläre Ausdrücke sind doch eigentlich recht "mächtig", das muss dafür doch eine Möglichkeit geben, ein Stichwort zum Googeln würde reichen...

himitsu 6. Mai 2011 14:31

AW: Regex: zwischen 2 Strings "matchen"
 
Code:
/bla.*((hierdasregexeineslinks).*)?.*blub/

luke2 6. Mai 2011 14:41

AW: Regex: zwischen 2 Strings "matchen"
 
Danke himitsu, das sieht schon ganz gut aus, es kommen schon 3 Treffer zurück, aber das Resultat sieht so aus (PHP):
Code:
Array
(
    [0] => Array
        (
            [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
        )

    [1] => Array
        (
            [0] =>
        )

    [2] => Array
        (
            [0] =>
        )

)
Und es soll ja so aussehen:
Code:
Array
(
    [0] => Array
        (
            [0] => <a href="#">a</a>
        )

    [1] => Array
        (
            [0] => <a href="#">b</a>
        )

    [2] => Array
        (
            [0] => <a href="#">c</a>
        )

)

himitsu 6. Mai 2011 15:28

AW: Regex: zwischen 2 Strings "matchen"
 
Die zweite Klammer (um das hierdasregexeineslinks) hast du im Code dringelassen?

himitsu 6. Mai 2011 15:35

AW: Regex: zwischen 2 Strings "matchen"
 
Am Ende müßte irgendwie sowas rauskommen.
Code:
Array
(
     [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
     [1] => <a href="#">a</a>
     [2] => <a href="#">b</a>
     [3] => <a href="#">c</a>

)
oder
Code:
Array
(
    [0] => Array
        (
            [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
            [1] => <a href="#">a</a>
            [2] => <a href="#">b</a>
            [3] => <a href="#">c</a>
        )

)
[0] = der gesamte gefundene Text
Nachfolgendes = die ganzen Referenzen


So wie es aussieht, läßt du dir sie subreferenzen nicht mit ausgeben. :zwinker:

luke2 6. Mai 2011 15:41

AW: Regex: zwischen 2 Strings "matchen"
 
Die Klammern sind drin, so habe ich es getestet:
Code:
if(preg_match_all('@bla.*((<a href="#">[a-z]</a>).*)?.*blub@',file_get_contents('a.txt'),$m)) print_r($m);
Zitat:

Zitat von himitsu (Beitrag 1099363)
Am Ende müßte irgendwie sowas rauskommen.

Genau, so sollte es aussehen.

himitsu 6. Mai 2011 15:49

AW: Regex: zwischen 2 Strings "matchen"
 
versuch mal PREG_SET_ORDER oder PREG_PATTERN_ORDER, bzw. PREG_SET_ORDER|PREG_PATTERN_ORDER

luke2 6. Mai 2011 15:59

AW: Regex: zwischen 2 Strings "matchen"
 
Hilft leider auch nicht :(

PREG_PATTERN_ORDER
Code:
Array
(
    [0] => Array
        (
            [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
        )

    [1] => Array
        (
            [0] =>
        )

    [2] => Array
        (
            [0] =>
        )

)
PREG_SET_ORDER
Code:
Array
(
    [0] => Array
        (
            [0] => bla<a href="#">a</a>,<a href="#">b</a>,<a href="#">c</a>blub
        )

)
PREG_SET_ORDER | PREG_PATTERN_ORDER

Gibt die Meldung "Invalid flags specified".

himitsu 6. Mai 2011 16:25

AW: Regex: zwischen 2 Strings "matchen"
 
Eigentlich müßte es doch so gehn?
Code:
@(?<=bla.*)(<a href="#">([a-z]*)</a>)(?=.*blub)@U
aber aus irgendeinem Grund geht es nicht :gruebel.

aber diese gehn, allerdings finden sie nur das erste und fangen dann mit der suche erst wieder nach dem blub an
Code:
@(?<=bla).*(<a href="#">([a-z]*)</a>).*(?=blub)@U
@(?<=bla)(.*<a href="#">([a-z]*)</a>.*)(?=blub)@U
Wobei das .* bei bla noch so geändert werden sollte/könnte, daß dort kein blub drin vorkommt
und in .* bei blub kein bla.

shmia 6. Mai 2011 16:44

AW: Regex: zwischen 2 Strings "matchen"
 
Aaah. :wall:
HTML mit RegEx parsen ist doch einfach nur Gemurkse.
Das ist dann genau der Code, der bei einer kleinen Änderung der Aussenwelt nicht mehr funktioniert und dann fängt das grosse Debuggen an.
Wozu gibt es denn in PHP das Document Object Model?
DOMDocument->loadHTML() aufrufen und damit weiterarbeiten.
Kleines Startbeispiel:
PHP-Quellcode:
$doc = new DOMDocument();
$doc->loadHTML($myhtml);
$tags = $doc->getElementsByTagName('a');
foreach ($tags as $tag)
{
  echo $tag->getAttribute('href').' | '.$tag->nodeValue."\n";
}

luke2 6. Mai 2011 18:24

AW: Regex: zwischen 2 Strings "matchen"
 
Ich werde es dann wohl doch über den Umweg lösen, es scheint wohl doch recht kompliziert zu sein...

Danke jedenfalls für die Hilfe, himitsu, auch wenn ich deine Ausdrücke noch nicht so recht verstanden habe :lol:

himitsu 6. Mai 2011 20:30

AW: Regex: zwischen 2 Strings "matchen"
 
Look-Ahead und Look-Behind (zusammen Look-Around) werden zwar gesucht, aber nicht in das Suchergebnis aufgenommen.
Es gibt da auch noch Negative-Look-Ahead und Negative-Look-Behind, welche prüfen, ob etwas nicht vorkommt.

Somit können auf diese Weise die Suchmuster sich teilweise überlappen und werden von preg_match_all dennoch gefunden.
In diesem Fall könnten bla und blub in mehreren Suchergebnissen vorkommen, da nur der jeweilige Link in den Ergnissen vorkommt.


Alle Zeitangaben in WEZ +1. Es ist jetzt 14:50 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz