AW: wie Adresse auseinandernehmen
7. Sep 2012, 13:08
Hallo,
weiter oben schrieb ich, dass ich mich seit vielen Jahren mit dem Thema beschäftige.
Wir haben zuletzt die Erfahrung gemacht, dass selbst Profiwerkzeuge wie qAdress und Uniserv (wo vermutlich viele Jahre Manpower hinterliegen) es nicht für alle Daten schaffen.
Bei allen Adressbeständen sollte man tunlichst drauf achten, das Straße, Hausnummer und irgendwelche Zusätze, nie in ein Feld "gedaddelt" werden, man bekommt es nicht auseinander (und Auszubildende haben besseres verdient, als diesen "Mist" geradezubiegen). Und behaupte mir niemand, Eingemeindungen und Straßenumbenennungen kommen selten vor. Kein bundesweiter Straßenbestand ist nach einem viertel jahr noch korrekt.
Große Adressbestände sollte man immer gegen vollständige Straßenverzeichnisse referenzieren und im Adressbestand nur den Fremdschlüssel auf diese Referenz ablegen (also die Daten normalisieren). Dies hat auch den Vorteil, dass bei Eingemeindungen, Straßenumbenennungen... nur die Daten in der Referenz geändert werden müssen und nicht die Datenbestände korrigiert werden müssen.
Die Masse der Straßennahmen ist fast überall in der Form Straße Hausnummer vorhanden, damit kommt man sicherlich locker über 95%. Der Rest ist auch über reguläre Ausdrücke nicht komplett korrekt aufzulösen. Man kann sich da noch soviele Muster überlegen, es gibt immer wieder Anwender, die noch eine weitere Idee haben, wie man da Murx hineinbekommt. In den letzten ca. 20 Jahren ist es mir jedenfalls nicht gelungen eine 100%ige Lösung zu finden oder jemanden zu finden, der diese bereits hat. Und ich bin mir sicher, gäbe es diese 100%ige Lösung, wäre sie in Profiwerkzeugen enthalten.
Sollte hier jemand diese Lösung finden, so meine Empfehlung: Patent auf den Algorithmus anmelden und meistbietend verkaufen oder lizensieren.
|