AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Die Delphi-IDE Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?
Thema durchsuchen
Ansicht
Themen-Optionen

Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?

Ein Thema von Rollo62 · begonnen am 26. Mai 2020 · letzter Beitrag vom 28. Mai 2020
Antwort Antwort
Benutzerbild von Assarbad
Assarbad

Registriert seit: 8. Okt 2010
Ort: Frankfurt am Main
1.234 Beiträge
 
#1

AW: Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?

  Alt 27. Mai 2020, 10:42
Hab das jetzt mal mit ripgrep in meinem Home-Verzeichnis durchexerziert:
Code:
rg -P '[^\x00-\x7FÄÖÜäöüß]'
... du kannst andere Zeichen zwischen ß und ] einfügen.

Falls du dich mit RE noch nicht so auskennst: "[]" definiert eine Menge von Zeichen auf die der Ausdruck zutrifft, "^" negiert das, "\x00-\x7F" trifft auf alle ASCII-Zeichen (also 0..127) zu und dahinter folgen halt die Umlaute in Groß- und Kleinschreibung, sowie ß.

Was ich damit fand waren bspw. das Copyrightzeichen ©, Apostrophe ’ (statt ' auf der Tastatur), ², ●, µ, └, ─, à, í, î, ⍝, •, ‣, ⁃, χ, ⍺, ⍶, ⍵, ∇, ⍫, é, jede Menge Emojis (hunderte!) und diverse Zeichen die in einer anderen Codepage Sinn ergeben, aber nicht als UTF-8 interpretiert. Jetzt muß ich erstmal aufräumen, weil viel von dem Code eigentlich als UTF-8 daherkommen sollte.

Über 30000 Dateien in ~2 Sekunden.
Oliver
"... aber vertrauen Sie uns, die Physik stimmt." (Prof. Harald Lesch)
  Mit Zitat antworten Zitat
Rollo62

Registriert seit: 15. Mär 2007
4.176 Beiträge
 
Delphi 12 Athens
 
#2

AW: Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?

  Alt 27. Mai 2020, 13:59
Hab das jetzt mal mit ripgrep in meinem Home-Verzeichnis durchexerziert:
Code:
rg -P '[^\x00-\x7FÄÖÜäöüß]'
... du kannst andere Zeichen zwischen ß und ] einfügen.
Ja dankesehr, ich habs mal noch etwas erweitert
Zitat:
[^\x00-\x7FÄÖÜäöüßéáÉÁÍèàìÈÀÌí°^*/'"–“”+#]
Es geht um Gedankenstrich statt Minus, um Varianten der Anführungszeichen und solcherlei Gemeinheiten.

Ich habe es mit GrepWin portable probiert, allerdings zeigt es nur die Zeilen und nicht das genaue Vorkommen des Zeichens an, leider nicht die genaue Position.

Es bleibt deshalb mühsam, ich werde mir wohl doch ein kleines Tool dazu schreiben müssen.
  Mit Zitat antworten Zitat
Benutzerbild von Sherlock
Sherlock

Registriert seit: 10. Jan 2006
Ort: Offenbach
3.813 Beiträge
 
Delphi 12 Athens
 
#3

AW: Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?

  Alt 27. Mai 2020, 14:14
Ach, es geht darum es aus didaktischen Gründen selbst zu machen. Dann ist meine Lösung natürlich Mist.

Sherlock
Oliver
Geändert von Sherlock (Morgen um 16:78 Uhr) Grund: Weil ich es kann
  Mit Zitat antworten Zitat
Benutzerbild von Assarbad
Assarbad

Registriert seit: 8. Okt 2010
Ort: Frankfurt am Main
1.234 Beiträge
 
#4

AW: Womit kann man versteckte Unicode/ASCII-Zeichen im Code finden ?

  Alt 27. Mai 2020, 16:51
Ach, es geht darum es aus didaktischen Gründen selbst zu machen. Dann ist meine Lösung natürlich Mist.


Es geht um Gedankenstrich statt Minus, um Varianten der Anführungszeichen und solcherlei Gemeinheiten.
Jupp, und alle "aktiven" Zeichen mußt du per Backslash auszeichnen ("escapen").

Ich habe es mit GrepWin portable probiert, allerdings zeigt es nur die Zeilen und nicht das genaue Vorkommen des Zeichens an, leider nicht die genaue Position.
Du meinst jetzt farblich das Vorkommen innerhalb der Zeile oder so?

Ansonsten probier doch mal PowerGREP. Das läßt sich für eine gewisse Zeit auch als Trialversion benutzen.
Oliver
"... aber vertrauen Sie uns, die Physik stimmt." (Prof. Harald Lesch)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:19 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz