OK, ich versuchs mal an einem Beispiel deutlich zu machen:
Angenommen in der ersten Datenbank steht der String: "Hägar lügt nie"
Dann könnte es sein, das in der zweiten Datenbank folgender String steht, wenn er denn vorhanden ist:
1. "Häger lügt nie" also kein
HTML Code oder
2. "Hägar lügt nie" also nur erstes Soderzeichen ist
HTML Code oder
3. "Hägar lügt nie" nur zweites Sonderzeichen ist
HTML Code oder
4. "Hägar lügt nie" alle Sonderzeichen sind
HTML Code
Wenn ein String 3 Umlaute enthält kann es noch weitaus mehr Möglichkeiten geben. Das es solche Inkonsequenzen in der zweiten Datenbank überhaupt giebt, liegt an dem Programmierer der
HTML Seiten auf den ich leider keinen Einfluss habe. Hätte er konsequent alle Sonderzeichen in
HTML geschrieben, gäbe es das Problem nicht und ich bräuchte auch keine 2 String-Variabeln in meinem Codebeispiel(s und s2).
Mit meinem oben genannten Code Beispiel(also wenn ich alle Sonderzeichen austauschen würde) würde ich aber nur die erste und die letzte der 4 Möglichkeiten finden. Die Sache, mit zwei Strings(s und s2) ist ja auch nicht besonders pfiffig. Ich bräuchte eine Routine, die in einer Schleife den String so oft wie nötig ändert und immer wieder prüft, ob der String in der zweiten Datenbank vorhanden ist. Außerdem bräuchte die Schleife auch 'ne Abbruchbedingung für den Fall, dass der String gar nicht vorhanden ist.
Ich hoffe, jetzt ist es verständlicher.
Gruß und frohe Ostern
Gambit