AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

HTML2Text - noch buggy? [Diskussion]

Ein Thema von Matze · begonnen am 13. Aug 2005 · letzter Beitrag vom 13. Aug 2005
Antwort Antwort
Seite 2 von 2     12   
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#11

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 16:42
Hi bigg,

immer wenn ein Quelltext monotone Passagen aufweist, wie deiner die endlose If-Strecke, dann macht es Sinn nach einer Alternative zu suchen. Für deinen Zweck wäre ein Dictionary eine gute Lösung und die StringList bietet dir über die Objects[] sogar noch die Lookup-Funktionalität.

Wenn du die vom W3 Consortium herausgegebene Liste der character entities für den Ansi-Bereich (#160 bis #255 und die 5 Metazeichen quot, amp, gt, lt und apos) in eine StringList einträgst,

sl.AddObject('quot', Pointer(34)); dann kannst du zumindest den Code für die Übersetzung der named entities deutlich übersichtlicher gestalten.

Freundliche Grüße vom marabu

PS: HTML2Text ist vielleicht etwas irreführend, denn es wird ja kein markup code in Text umgewandelt. Und vergiss nicht, dass character entities auch durch " oder & #34; repräsentiert werden können.
  Mit Zitat antworten Zitat
Benutzerbild von turboPASCAL
turboPASCAL

Registriert seit: 8. Mai 2005
Ort: Sondershausen
4.274 Beiträge
 
Delphi 6 Personal
 
#12

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 16:50
Zitat von bigg:
Code:
  ...
  [b]if[/b] s = 'uml' [b]then[/b] Result := [color=#ff001f]'¨';[/color]
  [color=green]// if s = 'uml' then Result := '~';[/color]
  ...
Fehler vom DP - Parser ?!
Matti
Meine Software-Projekte - Homepage - Grüße vom Rüsselmops -Mops Mopser
  Mit Zitat antworten Zitat
bigg
(Gast)

n/a Beiträge
 
#13

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 17:01
@marabu:
Da gebe ich dir vollkommen recht, so könnte man die Liste durchlaufen und gegenfalls abbrechen,
sofern ein Sonderzeichen gefunden wurde.

@turbo:
Ja, ist ein Fehler des Parsers.
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#14

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 17:06
Bitte die Liste NICHT durchlaufen!

Delphi-Quellcode:
var
  slDict: TStringList;
  s: string;
  index: integer;
begin
  s := 'quot';
  slDict.AddObject(s, Pointer(34));
  index := slDict.IndexOfName(s);
  if index < 0
    then CheckForCodedEntity(s)
    else s := Chr(Integer(slDict.Objects[index]));
end;
marabu

PS: Du denkst bestimmt daran, dass du slDict.CaseSensitive auf true setzen musst, stimmts?
  Mit Zitat antworten Zitat
bigg
(Gast)

n/a Beiträge
 
#15

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 20:27
moin marabu,

Zitat:
PS: Du denkst bestimmt daran, dass du slDict.CaseSensitive auf true setzen musst, stimmts?
Ich denke nicht daran Sollte ich etwa?
Und warum sollte ich es so, wie in deinem Beispiel machen?
Wo ist da der Vorteil gegenüber einer normalen Liste?
  Mit Zitat antworten Zitat
Benutzerbild von malo
malo

Registriert seit: 19. Sep 2004
2.115 Beiträge
 
#16

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 20:35
Zitat von bigg:
moin malo,

was ignoriere ich
Ich habe doch Flockes und Marabu's- Kommentar befolgt.
Ich meinte einmal, dass "uml;" als Rückgabewert der Funktion HTML2Char "&uml;" zurückgegeben hat. Dass es ein Fehler im DP-Parser war, wusste ich nicht. Trotzdem bist du darauf nicht eingegangen. Und auch der Ratschlag mit der Performence (hinter jedes if ein else) wurde (noch) nicht berücksichtigt.

Sorry, wenn ich etwas "hart" aufgetreten bin, aber mir ist halt aufgefallen, dass zu beiden Kritiken nichts geantwortet/getan wurde
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#17

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 20:45
Zitat von bigg:
Ich denke nicht daran - Sollte ich etwa?
"Auml" ist nicht "auml" - erinnerst du dich? Wenn du CaseSensitive nicht einschaltest, dann wird ab und zu der falsche Index ermittelt.

Zitat von bigg:
Und warum sollte ich es so, wie in deinem Beispiel machen?
Meine Beiträge sind ein Angebot und kein Diktat - es tut mir sehr leid, wenn ich missverstanden werde.

marabu
  Mit Zitat antworten Zitat
Benutzerbild von Mystic
Mystic

Registriert seit: 18. Okt 2003
Ort: Flerzheim
420 Beiträge
 
Turbo Delphi für Win32
 
#18

Re: HTML2Text - noch buggy?

  Alt 13. Aug 2005, 21:30
Es gibt auch die Form (das Beispiel hier steht für das Zeichen ) für Character Entities. Entities mit Zahlen bis 255 stehen für Zeichen aus dem ASCII-Zeichensatz, alles darüber für Zeichen aus dem Unicode-Zeichensatz.

edit: So wies aussieht hat escaped das Board hier die numerischen Entities nicht.
Jan Steffens
Der Fachwortgenerator - 100% Schwachsinn --- Der UPnP Router Manager - Kommentare erwünscht!
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 2     12   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:00 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz