AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

nl2br(), nur nicht für HTML-Code

Ein Thema von Matze · begonnen am 12. Jul 2006 · letzter Beitrag vom 13. Jul 2006
Antwort Antwort
Seite 2 von 2     12   
Benutzerbild von Matze
Matze
(Co-Admin)

Registriert seit: 7. Jul 2003
Ort: Schwabenländle
14.929 Beiträge
 
Turbo Delphi für Win32
 
#11

Re: nl2br(), nur nicht für HTML-Code

  Alt 12. Jul 2006, 23:41
@Frederic: Ja, nur ich bin verantwortlich dafür, sonst würde ich auch kein HTML-Code zulassen.

@Bigg: Ich dachte auch, dass ich einfach einen Tag um den HTML-Code setze und dieser Tag dann "weggeparst" wird und die darin enthaltenen Absätze nicht konvertiert werden. Das wäre eine sehr schöne Lösung finde ich, nur müsste ich da ja reguläre Ausdrücke verwenden und ich habe keine Ahnung, wie die aussehen müssen.
  Mit Zitat antworten Zitat
bigg
(Gast)

n/a Beiträge
 
#12

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 00:12
Zitat von matze:
@Bigg: Ich dachte auch, dass ich einfach einen Tag um den HTML-Code setze und dieser Tag dann "weggeparst" wird und die darin enthaltenen Absätze nicht konvertiert werden. Das wäre eine sehr schöne Lösung finde ich, nur müsste ich da ja reguläre Ausdrücke verwenden und ich habe keine Ahnung, wie die aussehen müssen.
Ach was, reguläre Ausdrücke benötigst du dafür nicht, ledglich eine kleine Auseinandersetzung mit einem für dich doch nicht unbekannten Thema. Du hast doch einen Editor mit Syntaxhighlighting geschrieben, der im Grunde nach dem selben Schema funktioniert.

1. In allen nicht HTML-Tags musst du HTML deaktivieren, indem du die Sonderzeichen "<" und ">" ersetzt.
2. Du benötigst eine Funkion ähnlich pos() die Anfang und Ende des jeweiligen Tags suchen.
Die Spitzen klammern werden nur dann ersetzt, wenn Anfang und Ende existieren. Da beide Tags die gleiche Länge haben kannst du sogar überschreiben.

3. ...

Wie wäre es, wenn du das ganze mal in Delphi umsetzt, kommentierst und nach PHP portierst? :>
Oder du suchst dir eine fertige Lösung bzw. passt diese dann noch an. Dat kriste doch hin
  Mit Zitat antworten Zitat
ehoffman

Registriert seit: 3. Jan 2006
Ort: Braunschweig
15 Beiträge
 
Delphi 2006 Enterprise
 
#13

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 03:04
Hallo zusammen,

normalerweise lese ich hier nur mit, da ich zu den Delphi-Problemen nie wirklich etwas gutes sagen kann In diesem Fall kann ich aber durchaus auch etwas beitragen (denke ich zumindest). Grundsätzlich sollte die gesuchte Funktionalität mit folgender Regular Expression nach der in Perl verwendeten Syntax machbar sein (da nach PHP gefragt ist der Code auch in PHP):

Delphi-Quellcode:
preg_replace("/([^>])[\r\n]/", "\\1
", $input);
Damit werden alle Zeilenende (\r oder \n) mit einem "
" ersetzt die nicht an einem geschlossenen HTML-Tag enden. Insgesamt würde ich das dann etwa folgendermassen verwenden:

Delphi-Quellcode:
<?php
// Beispiel Eingabe aus dem Posting
$input = "Bla bla blubb di wupp\n".
         "hier eine neue zeile\n".
         "und da noch eine\n".
         "wuppdi und nun folgt eine Tabelle:\n".
         "\n".
         "<table>\n".
         " <tr>\n".
         " <td>Hallo</td>\n".
         " </tr>\n".
         "</table>\n".
         "\n".
         "Hier wieder Text\n".
         "mit Zeilenumbruch\n";

// Ersetze Windows Zeilenendungen durch ein einfaches \n wie unter UNIX ueblich
$input = preg_replace("/\r\n/", "\n", $input);

// Ersetze Mac oder UNIX Zeilenendungen durch ein
 wenn nicht hinter
// schließenden HTML-Tag
echo preg_replace("/([^>])[\r\n]/", "\\1
", $input);
Damit werden somit alle Zeilenendungen durch "
" ersetzt die sich nicht direkt hinter einem schließenden HTML-Tag befinden - es werden also auch die Zeilenenden erfasst die innerhalb eines HTML-Tags liegen, z.B. bei:

Delphi-Quellcode:
$input = "Bla bla blubb di wupp\n".
         "hier eine neue zeile\n".
         "und da noch eine\n".
         "wuppdi und nun folgt eine Tabelle:\n".
         "\n".
         "<table>\n".
         " <tr>\n".
         " <td>Hallo\n".
         " auch hier ist noch Text\n".
         " und hier sowieso\n".
         " aber nun ist genug</td>\n".
         " </tr>\n".
         "</table>\n".
         "\n".
         "Hier wieder Text\n".
         "mit Zeilenumbruch\n";
Die Bedingung in obigem Regex, wenn kein "
" gesetzt werden soll ist das vor dem Zeilenumbruch ein ">" steht. Eventuelle Leerzeichen (wie hier im Beispiel zur Formatierung genutzt) bleiben erhalten. Es sollte auch darauf geachtet werden, dass alle ">" die nicht mit HTML-Tags zu tun haben (z.B. in math. Formeln) und nach denen ein zu konvertierendes Zeilenende steht vor der Konvertierung der Zeilenenden verschwunden sind, da es sonst nicht konvertiert werden würde. Hier könnte die PHP-Funktion "htmlspecialchars" helfen, da aber im Text HTML-Tags vorkommen können kann die Funktion nicht verwendet werden (auch die HTML-Tags selber würden damit geändert). Das muss also irgendwie im Editor geleistet werden - sprich HTML-Entities "abfangen" und ersetzen.

Noch eine Anmerkung: Das Ganze sollte im Prinzip funktionieren, aber HTML Code kann manchmal recht komplex werden - insbesondere wenn der Editor nicht bekannt ist - insofern keine Garantie das der Code in jedem Fall zum gewünschten Ergebnis führt

Viele Grüße,
Eike
Eike
  Mit Zitat antworten Zitat
Benutzerbild von Matze
Matze
(Co-Admin)

Registriert seit: 7. Jul 2003
Ort: Schwabenländle
14.929 Beiträge
 
Turbo Delphi für Win32
 
#14

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 07:03
Hi

Zitat von bigg:
2. Du benötigst eine Funkion ähnlich pos() die Anfang und Ende des jeweiligen Tags suchen.
Die Spitzen klammern werden nur dann ersetzt, wenn Anfang und Ende existieren. Da beide Tags die gleiche Länge haben kannst du sogar überschreiben.
Nur kann das manuelle Parsen recht langsam werden, darum wollte ich das nicht so.

Zitat von ehoffman:
In diesem Fall kann ich aber durchaus auch etwas beitragen (denke ich zumindest).
Danke, das ist schonmal super, nur noch nicht ganz perfekt.

Bei Code wie:

Code:
[...] hier steht ein text

<div class="center">[img]...[/img]</div>
Wird nach der Anwendung des regulären Ausdrucks kein Absatz zwischen dem text und dem darauf folgenden Bild gemacht. Der Text klebt also direkt über dem Bild, was mir noch nicht gefällt. Ansonsten funktioniert es, soweit ich das sehen kann, alles bestens. Aber auch mit dem kleinen Schönheitsfehler könnte ich leben.

Zitat von ehoffman:
Noch eine Anmerkung: Das Ganze sollte im Prinzip funktionieren, aber HTML Code kann manchmal recht komplex werden - insbesondere wenn der Editor nicht bekannt ist - insofern keine Garantie das der Code in jedem Fall zum gewünschten Ergebnis führt
Ich schreibe jedes Zeichen von Hand, nutze also keinen WYSIWYG-Editor oder Ähnliches, lediglich einen normalen Editor mit Syntaxhighlightning.

Was mich dennoch interessieren würde (ich weiß nicht, ob ich das so mache):
Angenommen, ich fasse solche komplexeren HTML-Blocke in einen -BBCode. Wie kompliziert wäre es dann, das mit regulären Ausdrücken zu lösen?
  Mit Zitat antworten Zitat
ehoffman

Registriert seit: 3. Jan 2006
Ort: Braunschweig
15 Beiträge
 
Delphi 2006 Enterprise
 
#15

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 14:27
Hallo,

Zitat von Matze:
Wird nach der Anwendung des regulären Ausdrucks kein Absatz zwischen dem text und dem darauf folgenden Bild gemacht. Der Text klebt also direkt über dem Bild, was mir noch nicht gefällt. Ansonsten funktioniert es, soweit ich das sehen kann, alles bestens. Aber auch mit dem kleinen Schönheitsfehler könnte ich leben.
Damit sollte es gehen:
Delphi-Quellcode:
preg_replace("/(([^>])[\r\n])|^([\r\n])/m", "\\1
", $input);
Zitat von Matze:
Was mich dennoch interessieren würde (ich weiß nicht, ob ich das so mache):
Angenommen, ich fasse solche komplexeren HTML-Blocke in einen -BBCode. Wie kompliziert wäre es dann, das mit regulären Ausdrücken zu lösen?
Also soooo super toll kenne ich mich mit den Perl Regex auch nicht aus, aber meiner Meinung nach würde diese Vorgehensweise das Ganze nicht sonderlich erleichtern. Du müßtest dann zunächst mal die Eingabe aufteilen in "Nicht-HTML" und in "HTML" (also innerhalb von ). Das ginge mit preg_replace und einer zusätzlichen Funktion recht einfach. Die Funktion selber ersetzt dann quasi die Leerzeichen. Das würde also pro gefundenem Block (HTML/Nicht-HTML) ein Funktionsaufruf sein. Da sollte obiges regex schneller arbeiten.

Ansonsten kann man das auch "von Hand" also ohne regex zerlegen - aber das kommt meiner Meinugn nach letztendlich alles auf das gleich raus.

Viele Grüße,
Eike
Eike
  Mit Zitat antworten Zitat
Benutzerbild von S2B
S2B

Registriert seit: 1. Feb 2004
Ort: Aachen
1.268 Beiträge
 
#16

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 16:05
Warum parst du eigentlich nicht beim Absenden und trägst das ganze (evtl. in einer neuen Spalte) direkt so in die Datenbank ein? Das sollte in jedem Fall schneller sein, egal, welche Lösung du verwendest...
Simon Praetorius
Gruß
S2B
  Mit Zitat antworten Zitat
Benutzerbild von Matze
Matze
(Co-Admin)

Registriert seit: 7. Jul 2003
Ort: Schwabenländle
14.929 Beiträge
 
Turbo Delphi für Win32
 
#17

Re: nl2br(), nur nicht für HTML-Code

  Alt 13. Jul 2006, 17:52
Zitat von ehoffman:
Damit sollte es gehen:
Delphi-Quellcode:
preg_replace("/(([^>])[\r\n])|^([\r\n])/m", "\\1
", $input);
Wunderbar, herzlichen Dank.

Stimmt, ob das andere viel bringt weiß ich auch nicht.

Zitat von S2B:
Warum parst du eigentlich nicht beim Absenden und trägst das ganze (evtl. in einer neuen Spalte) direkt so in die Datenbank ein? Das sollte in jedem Fall schneller sein, egal, welche Lösung du verwendest...
Schneller beim Auslesen ja, da gebe ich dir recht. Doch wenn ich dann einen Beitrag bearbeiten möchte und überall dann diese zusätzlichen HMTL-Tags habe, dann ist das sehr unübersichtlich und erschwert mir das Editieren nur unnötig.
Sollte es einmal merklich langsamer werden, habe ich ja immer noch die Option, das ganze zu optimieren und deinen Vorschlag umzusetzen.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 05:48 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz