Den Markt und sich selbst objektiv bewerten. Mit den Spezialisten für ECM-Research im deutschsprachigen Raum.

Migration von ECM-Systemen


Gastbeitrag HAVI


Diplom-Physiker H. Jürgen Schröder ist seit 1998 Gesellschafter bei HAVI und dort speziell für den Bereich Migration verantwortlich.
H. Jürgen Schröder wurde 1965 in Scheeßel geboren. Nach seinem abgeschlossenen Physikstudium an der Universität Hamburg stieg er Anfang 1997 als Programmierer und Projektmanager bei HAVI ein. Dort ist er seit einigen Jahren hauptverantwortlich für den Bereich DMS-Migrationen, dem Hauptgeschäftsfeld der HAVI Solutions GmbH & Co. KG.
Seit 1998 ist H. Jürgen Schröder zudem Gesellschafter bei HAVI und wirkt seitdem auch bei der Leitung des Unternehmens sowie der Planung und Festsetzung von Unternehmensstrategien und -zielen mit.

Datenmigration made by HAVI

Ein Migrationsprojekt beginnt – wie viele andere IT-Projekte auch – mit einer Analysephase und der Erstellung eines DV-Feinkonzepts. Ziel dieser Projektphase ist die Abstimmung der Projektvorgehensweise mit allen Beteiligten, wie z. B. auch den Fachabteilungen, die Definition von Milestones und die Abnahme eines Migrationskonzepts durch die Revision. Dabei sind folgende Punkte zu betrachten:

  • Ermittlung der relevanten Informationen des Systemumfelds

  • Analyse des Archiv-Dokumentenbestands bzw. der Datenträger

  • Möglichkeiten und Konsequenzen, die sich aus ggf. unterschiedlichen Alternativen für die Migration ergeben (z. B. für unterschiedliche Datenquell- und -zielformate, Vorgehensweisen etc.)

  • Erstellung eines Konzepts zur Überprüfung/Gewährleistung der vollständigen Übernahme aller vorhandenen Dokumente (Thema Revisionssicherheit)

  • Ermittlung der Rahmenbedingungen (Zieltermin, Kostenrahmen, Durchführungsort)

  • Detaillierte Kostenbetrachtung und Erstellen eines vorläufigen Zeitplans der Migrationsdurchführung (Zeitstrecken)

  • Festlegung eines Frozen-Zone- und Cut-Over-Termins

  • Abnahme des DV-Feinkonzeptes

In der Regel existieren zwei oder mehrere Generationen von Medien, auf denen die archivierten Dokumente abgelegt sind (Produktion und Backup). Um die Tagesproduktion und die betrieblichen Abläufe nicht zu stören, wird die Datenmigration von den Backup-Medien durchgeführt. Zunächst wird geprüft, ob die Datenträger konsistent sind und ob eine Migration von den Backup-Medien überhaupt möglich ist.

Die Medien werden in das HAVI-Rechenzentrum nach Hamburg verbracht. Parallel dazu wird ein Export der Indexdatenbank vorgenommen. Mit diesem DB-Export wird eine Migrations-Datenbank aufgebaut. Neben den exportierten Indizes werden zusätzlich Statusfelder angelegt. Anhand dieser Felder kann nachvollzogen werden, wie viele Dokumente bereits von den Medien gelesen, ggf. konvertiert, für den Import bereitgestellt oder schon in das neue Archiv importiert wurden.

Nun beginnt das Auslesen der Medien. Diese werden jedoch nicht mithilfe des Quellsystem ausgelesen, sondern mit eigens dafür entwickelter Software. Dadurch erfährt der Lesevorgang im Gegensatz zu einem Export über das „alte“ Archivsystem eine enorme Performance. Die Auslesegeschwindigkeit kann so bis zu 15 mal höher liegen.

Durch den Einsatz mehrerer Jukeboxen lassen sich auch Hunderte von WORM-Medien in relativ kurzer Zeit auslesen. Hier kommt der größte Vorteil einer „harten“ Migration zum Tragen: Ein schnelles Auslesen der Medien ohne Beeinträchtigung der Arbeitsabläufe im Unternehmen.

Unmittelbar nach dem Auslesen erfolgt ein Abgleich zwischen Indexdatenbank und ausgelesenen Daten. Hier kommt es oft zu den ersten Inkonsistenzen. Zu einigen Indizes sind keine Dokumente vorhanden oder es wurden Dokumente ausgelesen, zu denen die korrespondierenden Indexwerte fehlen. Die Gründe hiefür können vielfältig sein. Alleine ein Crash der Datenbank kann zu solchen Fällen führen. In Absprache mit dem Anwender wird die weiter Vorgehensweise besprochen, wenn diese im Vorfeld nicht schon Bestandteil des Konzeptes ist. Dokumente ohne Indizes können z. B. für eine neue Dokumentenklasse bereitgestellt. Dadurch bietet sich die spätere Sichtung und ggf. Nachindizierung durch den Anwender.

Fehlen jedoch Dokumente zu existierenden Indizes oder sind Dokumente fehlerhaft auf dem Back-Medium abgespeichert worden, werden die entsprechenden Produktionsmedien auf diese Dokumente hin geprüft.

Jedes Dokument bzw. jede Datei wird beim Auslesen mit einer Checksumme versehen. Dadurch wird sichergestellt, dass die Daten sich während der Migration nicht verändern.

Bereits während des Auslesevorgangs werden Dokumente, die im TIFF- oder PDF-Format archiviert wurden, auf Lesbarkeit geprüft. Damit ergibt sich die Möglichkeit, solche Dokumente vor einem Import ins neue System auszufiltern. In einigen Fällen können solche defekten Dokumente auch wieder „repariert“ werden.

Im Gegensatz zu Image-Daten sind klassische CI-Daten wesentlich aufwendiger zu migrieren. Jedes System archiviert diese Daten auf unterschiedliche Art und Weise. So gibt es z. B. Fälle, in denen das Quellsystem Hintergrundformulare unterstützt, das Zielsystem aber nicht. In diesen Fällen gibt es unterschiedliche Vorgehensweisen. Die CI-Daten können zusammen mit den Hintergrundformularen in TIFF-Dokumente überführt werden. Dieser Weg ist durchaus gangbar, wenn im Rahmen der Systemumstellung auch eine Vereinheitlichung der Formate gewünscht wird. Alternativ können CI-Daten mit Hintergrundformularen aber auch in ein anderes Präsentationsformat, wie z. B. AFP (Advanced Function Presentation) oder PDF konvertiert werden. Mit einem geeigneten Client bzw. Viewer werden diese Dokumente originalgetreu angezeigt. Bevor man sich für einen Weg entscheidet, ist folgendes zu beachten:

  • Ist eine Konvertierung der Daten aus rechtlichen Gründen zulässig (Stichwort AO)?

  • Wie verhält sich das Datenvolumen bei einer Konvertierung von CI zu NCI?

Nachdem die Vollständigkeit der Dokumente geprüft ist, werden die ersten Dokumente für den Import in das Zielsystem vorbereitet. Zu den Dokumenten werden die Indexwerte in einem für das Zielsystem verständlichen Format bereitgestellt. Mit einer definierten Menge an Dokumenten wird ein Testimport durchgeführt. Neben dem eigentlichen Indexsatz, wird jedem Dokument zusätzlich das ursprüngliche Archivierungsdatum und die Dokumenten-ID des Quellsystems mitgegeben. Aufgrund dieser ID kann später die Vollständigkeit der Migration bei der Abnahme nachvollzogen werden.

Nach einem erfolgreichen Testimport beginnt der Import aller Daten in das System. Während weitere Medien noch ausgelesen werden, werden bereits bereitgestellte Daten in das Zielsystem importiert. Diese Parallelisierung der Migrations-Prozesse führt zusätzlich zu wesentlich kürzeren Projektlaufzeiten als bei anderen Migrationsvorgehensweisen.

Nach fast kompletter Übernahme der Altdaten ins neue System erfolgt schließlich die Phase der Systemumstellung: Der Cut-Over. Dieser findet meist an Wochenenden und Feiertagen statt. Dadurch erhält man den notwendigen zeitlichen Spielraum. Beim Cut-Over werden die restlichen erfassten Dokumente auf Medien archiviert, diese dann abgeschlossen und das Delta ermittelt. Die restlichen Dokumente werden gemäß dem vorher beschriebenen Verfahren bereitgestellt und in das Zielsystem importiert. Mit dem Import der letzten Dokumente wird die Abnahme nach den im DV-Konzept zuvor festgelegten Kriterien eingeleitet. Nach erfolgreicher Abnahme kann das Zielsystem produktiv gehen und die Migration der Daten des Altsystems ist erfolgreich abgeschlossen.