Und, naja, daß ein Aufdröseln eines XMLs in relationale Tabellen so schnell geht wie der Import bereits aufgedröselter
csv-Dateien - das bezweifle ich. Denkst du, das Aufdröseln gibt es umsonst?
Die Daten waren vorher (
CSV) tabellarisch, dann werden sie es als
XML wohl kaum nicht mehr sein. D.h. die Struktur ändert sich ja nicht, wohl aber das Format. Es geht aber
imho nicht um die paar Sekunden beim Import (wenn Oracle hier zu umständlich ist, dann schreibt man ein XSLT, das die Daten umdröselt, und zwar in das Format, das das Bulk Insert von Oracle am besten beherrscht. Kann auch
CSV sein
)
Wichtig ist doch, das man mit externen Zulieferern belastbare Vereinbarungen trifft, die jeder einhalten kann, und die zudem mit frei verfügbaren Tools ('
XML Validator') nachzuprüfen sind. Ich kann in meinen Vertrag ja auch schreiben, das eine Datei erst dann akzeptiert wird, wenn sie mit Hilfe der XSD auf
www.xmlvalidator.com validiert werden kann.
Wenn Du eine nicht validierte
XML-Datei bekommst, kannst Du Dich genauso auf die Nase legen, wie es mit einer
CSV-Datei passieren kann. Schlimmer sind nur noch die Lieferanten, die grundsätzlich den Industriestandard EXCEL nutzen und sich dann wundern, daß bei 65.000 Zeilen Schluß ist, falls sie es überhaupt bemerken.
Vollkommen korrekt. Das Stichwort ist 'nicht validiert'. Wenn ich Daten bekommen soll, wird darüber eine schriftliche Vereinbarung getroffen. Bestandteil des Vertrages ist die XSD. Das kann man auch intern so regeln (es muss ja kein Vertrag sein, Kollegen erfüllen auch mündliche Vereinbarungen)
Das das intern nicht so einfach ist oder -noch schlimmer- bei Kunden gar nicht durchsetzbar ist, steht auf einem anderen Blatt. Aber wenn ich o.g. Prämisse nicht mit den eingehenden Rohdaten bekomme, dann schreibe ich mir einen Filter, der das exotische Fremdformat in mein einheitliches Import-Format übersetzt. Und das geht dann durch den Importer.
Die Krönung ist der Datenlieferant aus den o.g. Zulieferern, der seine Daten in Word als Tabelle formatiert, aber jedes mal von einem anderen Praktikanten und sich dann wundert, das man das nur abtippen kann und nicht elektronisch einlesen. Aber ein sich änderndes
CSV-Format ist auch nicht schlecht. Wir sollten echt einen WTF-Thread aufmachen.