AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Programmierung allgemein Datenbanken wie Adresse auseinandernehmen
Thema durchsuchen
Ansicht
Themen-Optionen

wie Adresse auseinandernehmen

Ein Thema von khh · begonnen am 5. Sep 2012 · letzter Beitrag vom 7. Sep 2012
Antwort Antwort
Seite 3 von 3     123   
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#21

AW: wie Adresse auseinandernehmen

  Alt 7. Sep 2012, 09:26
Zum Beispiel weil:
Es ist unmöglich die Adresse z.B. mit RegEx auseinander zu nehmen.

Zum Thema: Ich hatte auch letztens eine Adresse ohne Hausnummer
Zitat:
Messe Essen
Halle 8
Norbertstraße
45131 Essen
Ich würde auch sagen, dass sich die Adresse nicht zuverlässig aus einem String extrahieren lässt. Man kann vielleicht 99% der Fälle mit einem guten RegEx erschlagen, aber beim Rest wird Handarbeit nötig...

Geändert von jfheins ( 7. Sep 2012 um 09:29 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Daniela.S
Daniela.S

Registriert seit: 1. Mär 2008
Ort: Niederösterreich
226 Beiträge
 
Delphi XE4 Enterprise
 
#22

AW: wie Adresse auseinandernehmen

  Alt 7. Sep 2012, 11:50
Ich finde es keineswegs unmöglich. Du meinst mit herkömmlichen Methoden kommst du über die 99% ?

Im Grunde wird mit dem String zerlegen nur selber etwas nachgebaut, das RegEx bereits von Haus aus bietet.
Mit RegEx kannst du die Anschrift zumindest recht einfach auch auf verschiedene Patterns prüfen und erkennen in welchem Format sie eingegeben wurde.
  Mit Zitat antworten Zitat
-=ZGD=-

Registriert seit: 25. Apr 2006
Ort: Bad Aibling
105 Beiträge
 
Delphi 10.1 Berlin Professional
 
#23

AW: wie Adresse auseinandernehmen

  Alt 7. Sep 2012, 12:09
Ich finde es keineswegs unmöglich. Du meinst mit herkömmlichen Methoden kommst du über die 99% ?

Im Grunde wird mit dem String zerlegen nur selber etwas nachgebaut, das RegEx bereits von Haus aus bietet.
Mit RegEx kannst du die Anschrift zumindest recht einfach auch auf verschiedene Patterns prüfen und erkennen in welchem Format sie eingegeben wurde.
Das unterschreib ich so.
Vorteil: Wenn du mal ungefähr weißt, wie es aufgebaut ist, sprich welches Pattern, kannst du gezielt Methoden darauf anwenden um Adressdaten zu extrahieren.
Stefan Michalk
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#24

AW: wie Adresse auseinandernehmen

  Alt 7. Sep 2012, 12:36
Ich finde es keineswegs unmöglich. Du meinst mit herkömmlichen Methoden kommst du über die 99% ?
Mit ist bewusst, was ein RegEx ist und was er kann. (Und was nicht.)

Mit Handarbeit meinte ich hier tatsächlich den Menschen, der sich die Adresse anguckt, scharf nachdenkt und dann (falls existent) die Hausnummer eintippen kann. Mit der Hand. Nix automatisch.
  Mit Zitat antworten Zitat
nahpets
(Gast)

n/a Beiträge
 
#25

AW: wie Adresse auseinandernehmen

  Alt 7. Sep 2012, 13:08
Hallo,

weiter oben schrieb ich, dass ich mich seit vielen Jahren mit dem Thema beschäftige.
Wir haben zuletzt die Erfahrung gemacht, dass selbst Profiwerkzeuge wie qAdress und Uniserv (wo vermutlich viele Jahre Manpower hinterliegen) es nicht für alle Daten schaffen.

Bei allen Adressbeständen sollte man tunlichst drauf achten, das Straße, Hausnummer und irgendwelche Zusätze, nie in ein Feld "gedaddelt" werden, man bekommt es nicht auseinander (und Auszubildende haben besseres verdient, als diesen "Mist" geradezubiegen). Und behaupte mir niemand, Eingemeindungen und Straßenumbenennungen kommen selten vor. Kein bundesweiter Straßenbestand ist nach einem viertel jahr noch korrekt.

Große Adressbestände sollte man immer gegen vollständige Straßenverzeichnisse referenzieren und im Adressbestand nur den Fremdschlüssel auf diese Referenz ablegen (also die Daten normalisieren). Dies hat auch den Vorteil, dass bei Eingemeindungen, Straßenumbenennungen... nur die Daten in der Referenz geändert werden müssen und nicht die Datenbestände korrigiert werden müssen.

Die Masse der Straßennahmen ist fast überall in der Form Straße Hausnummer vorhanden, damit kommt man sicherlich locker über 95%. Der Rest ist auch über reguläre Ausdrücke nicht komplett korrekt aufzulösen. Man kann sich da noch soviele Muster überlegen, es gibt immer wieder Anwender, die noch eine weitere Idee haben, wie man da Murx hineinbekommt. In den letzten ca. 20 Jahren ist es mir jedenfalls nicht gelungen eine 100%ige Lösung zu finden oder jemanden zu finden, der diese bereits hat. Und ich bin mir sicher, gäbe es diese 100%ige Lösung, wäre sie in Profiwerkzeugen enthalten.

Sollte hier jemand diese Lösung finden, so meine Empfehlung: Patent auf den Algorithmus anmelden und meistbietend verkaufen oder lizensieren.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 3 von 3     123   


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 19:05 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz