PowerGREP (absolut sein Geld wert und in Delphi geschrieben!) und
reguläre Ausdrücke. Alternativ ripgrep, aber dann vermutlich nur mit aktivierter PCRE2.
Du wirst ja sicher den Bereich des BMP eingrenzen können, oder?
Gibt es vielleicht in der IDE oder mit anderen Tools (Grep, RegEx, o.ä.) eine schnelle Suche aller Code-Stellen mit ungewöhlichen Unicode oder ASCII-Zeichen ?
Was sind denn für dich ungewöhnliche
Unicode-Zeichen? Alle außerhalb vom BMP?
ASCII ist ohnehin eine Untermenge von
Unicode, daher ist die Dopplung nicht aussagekräftig.
Aber deine Frage ist leider ungenau. Geht es dir um Zeichen die die man nicht sehen kann (Steuerzeichen ala LF usw.) oder um Zeichen die nicht allein stehen können (modifier symbol/letter)? Oder worum genau geht es? Schau mal in
diese Übersicht hier.
Und dann wäre halt die Frage ob du das Problem nicht schon:
- anhand des BOM auf wenige Dateien eingrenzen kannst
- durch Nutzung einer Schriftart mit möglichst weitreichender Unicode-Unterstützung das Problem umgehen kannst
... häh weder war das die Frage, noch ergibt die Frage wie du sie eingetippt hast viel Sinn. Es sei denn wir reden über komplett alternative Kodierungen ala
EBCDIC.