AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

[PHP] URLs umschreiben

Ein Thema von jfheins · begonnen am 2. Mai 2006 · letzter Beitrag vom 5. Mai 2006
Antwort Antwort
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#1

[PHP] URLs umschreiben

  Alt 2. Mai 2006, 21:12
Hallo erstmal,

ich bin mal wieder bei PHP und diesmal möchte ich gerne URLs umschreiben.

Genauer gesagt, habe ich den HTML-Quellcode und möchte jetzt (wahrscheinlich mit preg_replace()) alle links umschreiben sodass sie nicht mehr aucf die orginal-Seite zeigen sondern auf meine.

Also z.B. Seite http://server/dir/file.htm

Link auf datei.php >>> http://ich.de/script.php?url={http://server/dir/datei.php-base64encoded}
Link auf http://google.de >>> http://ich.de/script.php?url={http://google.de-base64encoded}

Also alle Links müssen:

- aufgelöst werden (relativ>absolut)

- base64encoded werden

- und dann als parameter zur URL des aktuellen Scripts angehangen werden.

Jetzt zu meinen Problemen:

Code:
#href=["'](.*)["']#gi
Das wäre mein Regex für die URL (im ersten Backref. zu finden) - ist der so ok ?

Und wie kann ich die möglicherweise relative URL auflösen ?

(Das encoden und anhängen krieg ich noch hin ...
  Mit Zitat antworten Zitat
Flare

Registriert seit: 26. Jan 2006
Ort: Leipzig
529 Beiträge
 
Delphi 7 Professional
 
#2

Re: [PHP] URLs umschreiben

  Alt 2. Mai 2006, 21:15
Kann auch sein, dass ich mich gewaltig irre, aber meiner Meinung nach werden alle Links bei der Ausgabe in absolute verwandelt...außerdem weißt du doch auf welcher Seite du dich befindest wenn du dort die Links überprüfst...


Flare
Willy Scheibel
  Mit Zitat antworten Zitat
Benutzerbild von faux
faux

Registriert seit: 18. Apr 2004
Ort: Linz
2.044 Beiträge
 
Turbo Delphi für Win32
 
#3

Re: [PHP] URLs umschreiben

  Alt 2. Mai 2006, 21:18
Zitat von Flare:
Kann auch sein, dass ich mich gewaltig irre, aber meiner Meinung nach werden alle Links bei der Ausgabe in absolute verwandelt...außerdem weißt du doch auf welcher Seite du dich befindest wenn du dort die Links überprüfst...
Bei der Ausgabe nicht, aber die meißten Browser machen das so, glaube ich.

Grüße
Faux
Faux Manuel
Wer weiß, dass er nichts weiß, weiß mehr, als der der nicht weiß, dass er nichts weiß.
GoTrillian
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#4

Re: [PHP] URLs umschreiben

  Alt 2. Mai 2006, 21:28


Ich habe HTML z.B.
Code:
[url="datei.htm"]Text[/url]
[url="http://google.de/dir/datei.htm"]Text[/url]
[url="/dir/datei.htm"]Text[/url]

[url="/datei.htm"]Text[/url]
[url="http://google.de/datei.htm"]Text[/url]
von http://google.de/dir/superseite.php

Und muss jetzt die ersten drei nach http://google.de/dir/datei.htm auflösen und die unteren beiden nach http://google.de/datei.htm - wie?

Und ist mein Regex richtig ? oder muss ich ihm irgendwie sagen, dass das abschließende ' bzw. " dasgleiche Zeichen ist, wie das anführende ?
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#5

Re: [PHP] URLs umschreiben

  Alt 3. Mai 2006, 23:20
Also - das Problem bleibt
  Mit Zitat antworten Zitat
nat

Registriert seit: 10. Nov 2005
216 Beiträge
 
RAD-Studio 2009 Pro
 
#6

Re: [PHP] URLs umschreiben

  Alt 4. Mai 2006, 02:38
mit den relativen links kannst du doch ganz einfach checken:
gucke ob der link mit http:// anfängt, wenn nicht is es
ein relativer link und knallst einfach die url der seite dran.
(evtl gefolgt von einem /).

edit1:
ich hab dir das ma eben in php hingeknallt.
müsste eigentlich funzen, habs nur 1-2x getestet.

Code:
<?php      
   function ReplaceCallback($hit)
   {
      //$hit[1] = "|'
      //$hit[2] = http|ftp
      //$hit[3] = url
      
      global $currentURL;
   
      //protokoll angegeben?
      if(!empty($hit[2]))
         $url = "{$hit[2]}://";
      else
      {
         //relativer link, akt. url anfügen
         $url = $currentURL;
         if($hit[3][0] != '/') $url .= '/';
      }
      
      $url .= $hit[3];
      $url = base64_encode($url);
      
      $result = " href={$hit[1]}http://www.meine-seite/script.php?url=$url{$hit[1]}";
      return $result;
   }
   
   //die url, dessen html man grade liest
   $currentURL = 'http://www.google.de';
   
   //der reg. ausdruck (für ftp & http links)
   $expr = '# href=(\'|")(?:(http|ftp)://)?(.*)\1#i';
   
   //quelltext einlesen
   $html = file("./test.htm");
   $html = implode("", $html);
   
   //links ersetzen
   $html = preg_replace_callback($expr, ReplaceCallback, $html);
   
   //ausgabe
   echo $html;
?>
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#7

Re: [PHP] URLs umschreiben

  Alt 4. Mai 2006, 21:51
Es geht soweit schon ... nur ist der regex ein bisschen zu greedy ...
Code:
$regex = '# href=(\'|")(http://)?(.*)\1#i';
Das isser ... und er nimmt z.B. als URL auch mal
Code:
http://www.server.com/" class="txt
aber danke schonmal ...
  Mit Zitat antworten Zitat
Benutzerbild von cruiser
cruiser

Registriert seit: 23. Dez 2003
Ort: Königsbrück/Sachsen
455 Beiträge
 
Delphi 7 Enterprise
 
#8

Re: [PHP] URLs umschreiben

  Alt 4. Mai 2006, 23:02
Mach ihn ungreedy (Modifier U)
Code:
$regex = '# href=(\'|")(http://)?(.*)\1#Ui';
Ich nehm den zusätzlichen Müll zurück *fg*
  Mit Zitat antworten Zitat
nat

Registriert seit: 10. Nov 2005
216 Beiträge
 
RAD-Studio 2009 Pro
 
#9

Re: [PHP] URLs umschreiben

  Alt 5. Mai 2006, 22:06
edit: hatte sich schon erledigt, hatte was überlesen


$expr = '# href=(\'|")(?http|ftp)://)?(.*?)\1#i';
müsste das ganze dann doch ungreedy machen (ungetestet)

edit2:
habs getestet, geht auch mit solchen links
Zitat:
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 05:00 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz