Ich versuche mich kurz zu fassen, weil wir
OT sind.
Eine Firma bekommt Daten von über 40 Zulieferern natürlich per
CSV.
Das trifft auf uns auch zu. Manche Zulieferer liefern jeweils für vier oder fünf Kunden, so daß am Ende täglich locker hundert Pakete eintreffen, die aus mehreren Dateien bestehen.
Die größeren Datenlieferungen bringen es täglich leicht auf 100 MB. Da purzeln die Gigabytes.
So - jetzt stell dir vor, das seien alles XMLs. Wieviel
overhead würde das bedeuten? Mir fehlt die Erfahrung das einzuschätzen - ich tippe auf das fünffache oder zehnfache Volumen. Bitte korrigieren, falls ich daneben liege. In jedem Falle ist das als Kostenfaktor wegen Speicherung und Sicherung nicht zu unterschätzen, zumindest in der Liga, in der wir spielen.
Es gibt noch einen zweiten Aspekt:
csv-Dateien harmonieren gut mit relationalen Datenbanktabellen. Mit
direct load sind die Daten im Nu in der Datenbank, wenn normalisierte Stammdaten in eigenen Tabellen vorgehalten werden müssen. Erst ein
XML zu parsen, nur um es letztlich doch in relationale Tabellen zu stecken, wäre ein unsinniger Aufwand, oder?
40 Zulieferer. Für jeden Zulieferer einen eigenen Dialog. Speichern der Einstellungen bringt etwas, aber nicht viel, weil die Daten manchmal auch per Dienstleister im Ausland (manuell) erfasst werden. Ja. Elektronisch erfasste Daten werden ausgedruckt, ins A.A.Ausland geschickt, dort eingetippt und dann per
CSV an die Quasibehörde geschickt. Per
FTP. Mal mit Komma, mal mit Semikolon. Oder als WORD-Datei. Willkürlich formatiert. Oder EXCEL. Mal so, mal so.
Naja. Das ist kein Problem, das der
csv-Datei angelastet werden kann. Hier hapert es an der Organisation. Andersherum gesagt: traust die Leuten, die kein wohlgeformtes
csv zu Wege bringen zu, daß sie gültige XMLs liefern?
Aber manchmal wird -höhöhö- der Ausdruck der vormals elektronisch erfassten Daten auch direkt an die Quasibehörde geschickt. Also ca. 500kg Papier. Die werden dann von eigens eingestellten professionellen Abtippern eingegeben. Zweimal. Weil diese Quasibehörde gibt es zwei Mal. Mmf. Grmpfl.
Ich hab' mich schon mehrmals gefragt, warum es hier im Forum keinen daily-WTF-Thread gibt.
Das wäre ein schöner Startbeitrag.
Nee, also in einen Importfilter mal einen Eingabe/Konfigurationsdialog einzubauen. Das hat was. Merke ich mir.
So etwas baue ich gerade. Ich sollte das mal vorstellen. Zu einem bestimmten Ansatz käme mir Manöverkritik ganz gelegen, bevor ich das festzurre.
"There are two hard things in computer science: cache invalidation, naming things, and off-by-one errors."