![]() |
RegEx - Unicode vs. Posix für alle druckbaren Zeichen
Hallo,
die Posix-Zeichenklasse [:print:] umfasst alle druckbaren Zeichen, sowie das Leerzeichen. Gibt es auch eine deratige Unicode-Eigenschaft, die alle druckbaren Zeichen sowie das Leerzeichen umfasst? |
Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
So, nun muss ich dieses Thema dochmal pushen; niemand eine Idee? :(
|
Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
also das ist eine Sammlung aller in XML erlaubten Unicodezeichen (diese dürften auch alle druckbar sein und sind vermutlich auch alle sichbar, bis auf ein paar "Leerzeichen")
Code:
wenn du da einfach die ersten 3 (Tabulator und Zeilenumbruck) wegläßt und dieses in ein RegEx-Suchmuster umwandelst, dann sollte es doch ausreichen?
#$09, #$0A, #$0D, #$20..#$007E, #$0085, #$00A0..#$D7FF, #$E000..#$FDCF, #$FDE0..#$FFFD
|
Re: RegEx - Unicode vs. Posix für alle druckbaren Zeichen
Danke himitsu,
das hat mich zur Lösung gebracht - einfach den Ausdruck negieren :)
Code:
\P{Cc}
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:06 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz