beschäftige mich seit vielen Jahren mit dem Thema
Dito!
Das Trennen von Strassennamen, Hausnummer und Hausnummerzusätze ist sehr schwierig. (es ist fast schon KI nötig)
Man braucht für jede Ausnahme extra Code der dies behandelt.
Meine letzte Idee (die ich aber noch nicht umgesetzt habe) war, dass man den String "
tokenizen" müsste.
A=Buchstabenkette
B=Einzelbuchstabe
9=Ziffernkette
8=Ziffernkette gefolgt von Punkt
x=Trennzeichen / oder - oder , oder .
_=Folge von Leerzeichen
Schlossberg 12, 3. Stock wäre also das Muster
A_9x_8_A
M 17,3 entspräche Muster
B_9x9
Für jedes Muster muss man sich zusätzlich speichern, wo die Strasse und wo die Hausnr steckt.
Mit 20 bis 50 verschiedenen Mustern kann man so evtl. alle Schreibweisen abdecken.