Kategorie: Best Practice, ECM-Suite von forcont, Elektronische Akten
2. März 2015 //

Digitale Archivierung von Massendokumenten

Archivierung von Massendokumenten ( © Fotolia_61657958_beawolf)

Immer wieder gibt es Situationen, bei denen unsere Kunden mit der Archivierung von Massendokumenten konfrontiert sind, seien es regelmäßige Informationsschreiben (Newsletter an Geschäftspartner, Mitarbeitermitteilungen, …) oder einmalige Schreiben (Preisanpassungsschreiben, Brief zu einer Rückrufaktion etc.). Gemeinsam haben die dabei entstehenden Dokumente eine gewisse "Gleichförmigkeit", d. h. sie haben eine nahezu gleiche Dokumentstruktur und einen sehr ähnlichen Inhalt, der sich nur in bestimmten Bereichen leicht unterscheidet. Die Herkunft dieser oft als Massenschreiben bezeichneten Dokumente sind zum einen Serienbriefe, die von einem Mitarbeiter des Unternehmens erzeugt werden und zum anderen entstehen solche Dokumente auch über ein Output-Management-System.

Oft wird der abschließende Druck und Versand der Dokumente über einen Druckdienstleister abgewickelt, der darauf spezialisiert ist, die fertigen Papierseiten "einzutüten", zu frankieren und auf den Postweg zu bringen. Nicht selten erhalten die Auftraggeber dann ein Medium (CD, DVD o. ä.) mit dem gedruckten Material in Digitalform zur Aufbewahrung zurück. Auch bei der Digitalisierung von Bestandsdokumenten bei der Einführung einer DMS-Lösung, wie z.B. einer Personalakte, werden diese von spezialisierten Scan-Dienstleistern in solcher Form bereitgestellt.

Um die Dokumente dem Bezugsobjekt, z. B. dem Kunden, Mitarbeiter oder der technischen Anlage zuordnen zu können, benötigt man Schlüsselinformationen zu diesen Bezugsobjekten.
Sowohl die Bereitstellung der Schlüsselinformationen, als auch der Inhalt des bereitgestellten Mediums kann von  Anbieter zu Anbieter recht unterschiedlich sein. Die nachfolgenden Varianten sind uns aus der Praxis bekannt:

Verbund-PDF
Verbund-PDFs sind riesige PDF-Dokumente, die alle Druckdaten pro Schreiben enthalten. Bei 3 verschiedenen Vorlagen sind dies also 3 PDF-Dateien mit ggf. tausenden Seiten. Variiert auch noch die Seitenzahl zwischen den Vorlagen, ist das Chaos perfekt. Um die passenden Schreiben mit dem gewünschten Bezugsobjekt verknüpfen zu können, müssen sie zunächst in Einzel-dokumente gesplittet werden. Dies kann oftmals pro Datei anhand einer der Vorlage entsprechenden, festen Seitenzahlangabe passieren. Seltener müssen Muster definiert werden, die das Ende oder den Anfang eines Einzeldokuments markieren. Ist der Druckdienstleister bereits erfahren oder wurde schon entsprechend beauftragt, liegen die Dokumente schon in einzelnen Dateien vor, so dass man sich diesen Schritt der Verarbeitung im Nachgang sparen kann.

Einzel-PDFs
In diesem Fall hat man bereits einzelne PDF-Dateien pro Dokument vorliegen und muss klären, wie die Zuordnung zum Bezugsobjekt genau erfolgen kann. Auch hier gibt es verschiedene gängige Verfahren:

  •  Der Druckdienstleister hat beim Druck schon ein wichtiges Kriterium wie die Kundennummer o.ä. für die Benennung der Datei verwendet. Diese Information aus dem Dateinamen kann direkt verwendet werden.
  • Der Druckdienstleister hat eine sogenannte Index-Datei bereitgestellt. Diese Textdatei enthält in einer einheitlichen Struktur zu jeder PDF-Datei die für den Druck verwendeten Informationen, wie Name, Adresse und eben auch z. B. die gewünschte Kundennummer.
  • Wurden die einzelnen PDF-Dateien aus einem riesigen Verbund-PDF herausgetrennt oder liegen weder Index-Datei oder sprechender Dateiname vor, bleibt einem oft nur der Blick in den Inhalt der Datei. Mit Hilfe von Werkzeugen, die PDF-Textinhalte extrahieren können, ist es dann z.B. möglich mittels eines regulären Ausdrucks ein Muster vorzugeben, das in bestimmten Dokumentabschnitten die nötigen Informationen markiert und sich diese extrahieren lassen.

Hat man die Verknüpfung mit dem Bezugsobjekt erfolgreich gemeistert, sind nun folgende wesentliche Voraussetzungen geschaffen:

  • eine Datei pro logischem Dokument, welches so physisch versendet wurde
  • die Attribute zu genau diesem Dokument, die den Objekt-Bezug herstellen und nach denen später gesucht werden kann, liegen vor bzw. können ermittelt werden

Nun stellt sich nur noch die Frage, wie man die Dokumente zusammen mit Ihren Attributen so archiviert, dass man sie bei Bedarf schnell und einfach wiederfindet. Dazu können PDF-Dokumente und Attribute über einen Import-Job entweder direkt archiviert oder so aufbereitet werden, dass sie über die forcont factory FX-Pipeline in genau das logische Archiv abgelegt und genau der ECM-Anwendung zugeordnet, in der sie später recherchiert werden sollen. Die Übergabe erfolgt dabei in einer immer gleich aufgebauten Ordner-Struktur.

 

Pipeline Ordner

 

 

Sind die Dokumente einmal über diese Ordner-Struktur an die Pipeline übergeben, kümmert sich diese um den Rest. Bei einem Fehler wird dieser entsprechend in der Administrations-Oberfläche signalisiert, kann behoben und das Dokument erneut im jeweiligen Verarbeitungsschritt vorgelegt werden. So geht nichts verloren und man kann sicher sein, dass alle Import-Dateien in der ECM-Anwendung und dem dahinter liegenden logischen Archiv landen und revisionssicher archiviert sind.

Anschließend kann man die Dokumente über die gewohnte Anwendungsoberfläche suchen und aufrufen - ohne ihnen ihren beschwerlichen Weg vom Ersteller, über den Druckdienstleister und der nachträglichen, schrittweisen Verarbeitung bis hin zur Archivierung über die Pipeline anzumerken.

 


Noch keine Kommentare für "Digitale Archivierung von Massendokumenten"

Schreibe einen Kommentar

Follow Us

Autoren

ARCHIV