Kategorie: Cloud Computing, Tipps & Tricks
11. Oktober 2011 //

Die neuen Office-Formate – eine Gabe und ein Fluch?

In diversen ECM-Projekten beschäftige ich mich tagtäglich mit den alten und neuen Microsoft Office Formaten. Sei es nur die einfache Ablage oder komplexere Anforderungen, wie zum Beispiel das Füllen von Feldern in Word-Dokumenten über die Dateieigenschaften. Damit kann einer Word-Vorlage über die in einer DMS-Anwendung hinterlegten Daten Leben eingehaucht werden. Fragt man sich nun, was bei dem Einsatz beider Formate innerhalb eines ECM- bzw. DMS-Systems zu beachten ist?

Beide Formate unterstützen
Nicht nur in ECM-Systemen ist es unabdingbar, die bisher gängigen Formate (.doc, .xls und .ppt) genauso zu unterstützen, wie die sich nun langsam durchsetzenden Open XML Dokumentformate (.docx, .xlsx, .pptx). Bei der Programmierung verhalten diese sich aber deutlich anders.

Die XML-Struktur der neuen Formate
Die neuen Formate sind, wie der Name schon sagt, sehr XML-lastig strukturiert. Dies hat den Vorteil, dass man nicht nur als Maschine, sondern auch als Mensch verstehen kann, was in der Datei so gespeichert ist. In den Abbildungen sieht man eine Teilstruktur des .docx-Formats. Sobald man benutzerdefinierte Eigenschaften verwendet, entsteht eine Datei custom.xml, in der die Inhalte abgelegt werden.

Die Dokumenteigenschaften werden in der custom.xml gespeichert
Die Dokumenteigenschaften werden in der custom.xml gespeichert.

Beispiel einer custom.xml

Beispiel einer custom.xml

Bei den älteren Formaten war dies nicht so einfach ersichtlich, da sie durch ihre proprietäre Binärform quasi nur durch Einsatz von Programmen sinnvoll interpretierbar sind. Somit wird mit den neuen Formaten die Entwicklung von Programmen zur Verarbeitung auf lange Sicht einfacher, jedoch muss man nun erst einmal zweigleisig fahren (.doc mit Programmcode 1 verarbeiten, .docx mit Programmcode 2 usw.).


Noch keine Kommentare für "Die neuen Office-Formate – eine Gabe und ein Fluch?"

Schreibe einen Kommentar

ARCHIV

Autoren

Follow Us