Speicherplatz? Zip das Zeugs.
Falls unser Admin nicht ohnehin schon komprimierte Verzeichnisse nutzt, ist das eine gute Idee.
Es gibt noch einen zweiten Aspekt:
csv-Dateien harmonieren gut mit relationalen Datenbanktabellen. Mit
direct load sind die Daten im Nu in der Datenbank
Genau, weil es ja nur ein Format gibt und einen Trenner...
Zitat:
Andersherum gesagt: traust die Leuten, die kein wohlgeformtes
csv zu Wege bringen zu, daß sie gültige XMLs liefern?
Es gibt kein 'wohlgeformtes
CSV'. Es gibt wohlgeformtes
XML (was mir auch egal wäre) und es gibt validiertes
XML (gegen ein Schema).
Naja, wir haben tatsächlich einen Lieferanten, bei dem immer nach einem Feiertag das Trennzeichen für einen Tag wechselt. Wir sind jedesmal auf's neue erstaunt.
Weiter gibt es einige Kandidaten, die es nicht schaffen, Quotes und Delimiter richtig zu escapen. Die sich sogar auf mehrmalige Nachfrage weigern, es richtig zu machen.
Im Großen und Ganzen aber gibt es keine Zweifel wie ein korrektes
csv aussehen muß.
Wenn deine Zulieferer alle mitspielen und wissen, was sie tun, können sie auch proprietäres Binärformat schicken. Jetzt schicken sie ein proprietäres Text-Format, aber wenigstens spielen sie mit.
Ich wäre der erste, der in unserem Laden ein Veto gegen ein Binärformat einlegt - und sicher nicht der einzige. Von Menschen lesbare Dateien sind im Sinne von "machs einfach" nicht zu schlagen. Gerade heute hatte ich einen Fall, da wurden Geldbeträge mit sechs Nachkommastellen importiert. Ein kurzer Blick in die Datei reichte aus, um zu sehen, daß die Nachkommastellen tatsächlich so geliefert wurden und nicht vom Importer aufgrund eines aberwitzigen Fehlers hinzugemogelt wurden.
Solch ein Binärformat wäre die Hölle für mich, ebenso wie für den Support, wenn ein Kunde anruft und behauptet, die eine Buchung aus dem Jahr 2005 sei falsch.
PS:
XML in einen Server geht genauso schnell und das Aufdröseln in Tabellen auch. Sind halt ein paar Zeilen mehr. Einmalig.
Ein paar Zeilen mehr? Ich persönlich schramme bei der Oracle-
XML-Syntax immer an meine geistige Kapazitätsgrenze.
Und, naja, daß ein Aufdröseln eines XMLs in relationale Tabellen so schnell geht wie der Import bereits aufgedröselter
csv-Dateien - das bezweifle ich. Denkst du, das Aufdröseln gibt es umsonst?
Aber jedem das Seine.
CSV hat jedenfalls
imho in der professionellen Softwareentwicklung und im Datenaustausch, der etwas auf sich hält, nichts verloren. Das ist nicht abwertend, sondern in meinem Umfeld so.
Wir sind fürchterlich off-topic. Deshalb sag' ich dazu mal nix.
"There are two hard things in computer science: cache invalidation, naming things, and off-by-one errors."