Ich benutze einen StreamReader, um
HTML-Seiten einzulesen, diese etwas zu ändern und dann per StreamWriter zurückzuschreiben. Dabei habe ich bemerkt, dass Zeichen verschluckt werden. Bspw. fehlen die rot markierten
Code:
<h2>bla bla [color=red]–[/color] bla bla bla</h2>
The children [...] You[color=red]’[/color]ll recognize [...]
Das sind nur 2 von einigen.
Ich habe schon versucht, beim StreamReader und StreamWriter eine andere Kodierung auszuwählen, bspw.
Code:
using(StreamReader sr = new StreamReader(FileName, System.Text.Encoding.UTF8))
{
fileContent = sr.ReadToEnd();
}
// ...
using(StreamWriter sw = new StreamWriter(FileName, false, System.Text.Encoding.UTF8))
{
sw.Write(fileContent);
sw.Flush();
sw.Close();
}
Aber entweder versaut das den Inhalt der Datei komplett, oder es ändert sich insofern gar nichts; die Zeichen verschwinden nach wie vor. Und so viele Kodierungsmöglichkeiten gibt es nicht bei
System.Text.Encoding. Hat jemand einen Tipp für mich, wie ich das ganze dennoch in den Griff bekommen kann?