Entschuldigt, hab ich irgendetwas nicht mitbekommen?
UTF-8 ist doch eine erweiterte
Ansi-Codierung, es gibt also keine 16-Bit Characters, somit sollte eine
Ansi-Text-Datei genauso lesbar sein wie eine UTF8-Text-Datei (oder andersherum).
Dann nimmt man sich die "Stop-Codes" xE0..x vor und schaut ob da etwas sinnvolles drin steckt.
Ggf. macht man einfach eine quantitative Analyse ob vllt. auffallend oft xE0 als Char auftaucht.
Gruß
K-H