Veröffentlicht: 13.02.13
Kolumne

Wer kümmert sich langfristig um Daten?

Wolfram Neubauer
Wolfram Neubauer ist seit dem 1. Januar 1997 der Direktor der ETH-Bibliothek. (Bild: ETH Zürich)
Wolfram Neubauer ist seit dem 1. Januar 1997 der Direktor der ETH-Bibliothek. (Bild: ETH Zürich) (Grossbild)

In der heilen Welt der gedruckten Medien war die Situation klar und übersichtlich: Die Bibliotheken archivierten Bücher, Zeitschriften und sonstige Medien, die Archive kümmerten sich um die langfristige Sicherung von Aktenmaterialien aller Art. Für die Sicherung von Forschungsdaten allerdings gab es keine konkreten Regelungen. Hin und wieder wurde etwa eine historische Bibliothek durch Feuer (teilweise) vernichtet oder ein weltberühmtes Stadtarchiv versank mit all seinen Schätzen im Boden. Insgesamt jedoch haben sich Archive und Bibliotheken über Jahrhunderte als die entscheidenden Einrichtungen zur Sicherung der kulturellen, historischen und wissenschaftlichen Überlieferung bestens bewährt.

Nun neigt sich die Zeit der alleinigen Herrschaft des Gedruckten dem Ende zu, und es stellt sich die Frage, wie es mit der langfristigen Sicherung der elektronischen Daten aussieht. Geht jetzt mit dem Drücken der Delete-Taste alles verloren? Ist es überhaupt notwendig und sinnvoll, jedes (möglicherweise unbedeutende) E-Mail zu archivieren? Haben wir einigermassen konkrete Vorstellungen, was mit den riesigen Datenmengen geschehen kann und soll? Gibt es überhaupt Techniken und Prozesse, mit denen die in Wissenschaft und Verwaltung produzierten elektronischen Daten sinnvoll archiviert werden können?

Fragen über Fragen, noch dazu die meisten einigermassen unangenehm! Um eine Antwort gleich vorwegzunehmen: Für die genannten und noch viele weiteren in diesem Kontext relevanten Fragen und Probleme gibt es bis heute zwar Ideen, vielleicht auch erste Lösungsansätze und -prozesse. Wirklich belastbare Strategien gibt es allerdings überhaupt nicht oder höchstens in Ansätzen.

Sprechen wir im universitären und wissenschaftlichen Kontext von elektronischen Daten, dann müssen wir zuallererst einmal fragen: Um welche Art von Daten geht es überhaupt? Vereinfacht lassen sie sich in drei Gruppen unterteilen. Bei der ersten Gruppe handelt es sich um Daten, die durch Lizenzierung von elektronischen Zeitschriften und elektronischen Büchern in die Universitäten gelangen und dort meist intensiv genutzt werden. Da die Bibliotheken diese Daten jedoch im Allgemeinen nicht besitzen, ist deren langfristige Verfügbarkeit nicht gesichert. Obwohl die Verlage den langfristigen Zugriff zusichern, sind hier erhebliche Zweifel angebracht. Wer weiss schon, ob ein Verlag im nächsten Jahr überhaupt noch existiert. Darüber hinaus ist bis heute nicht klar, was denn unter «langfristig» genau zu verstehen ist.

Die zweite Gruppe von elektronischen Daten umfasst diejenigen Datenmengen, die beispielsweise innerhalb der ETH Zürich selbst produziert werden. Dies sind einmal die «elektronischen Ergebnisse» aller administrativen Prozesse, also E-Mails, elektronischer Schriftverkehr, Publikationen etc. In diese Gruppe gehören darüber hinaus auch die elektronischen Daten, die beispielsweise durch Bibliotheken produziert bzw. vermittelt werden: digitalisierte Medien aller Art wie Bilder, alte Drucke, Grafiken, Reports, Dissertationen etc.

Die dritte Gruppe umfasst diejenigen Datenmengen, die direkt aus den unterschiedlichen Forschungsprozessen resultieren, also Messprotokolle, Laborjournale, Software, Datenreihen etc. So heterogen die einzelnen Forschungsaktivitäten sind, so heterogen sind auch die dabei produzierten Datentypen. In diesen Kontext gehören des Weiteren auch die Daten, die zurzeit unter dem Oberbegriff «Big Data» diskutiert werden, die also aus der Bearbeitung und Archivierung aussergewöhnlich umfangreicher Datenmengen resultieren.

Allein diese kurze Auflistung der möglichen Typen von elektronischen Daten an einer Hochschule macht deutlich, welch komplexe Aufgabe auf uns alle wartet. Mittlerweile haben viele Wissenschaftlerinnen und Wissenschaftler, viele Bibliothekarinnen und Bibliothekare, aber auch die politischen Entscheider die Brisanz des Themas erkannt. Haben wir bis heute die gedruckten Bücher und Zeitschriften einfach ins Regal gestellt und haben wir Archivalien, Briefe und Laborbücher mehr oder weniger unproblematisch in Archive eingelagert, ist dies für die Sicherung elektronischer Daten nicht mehr so einfach möglich.

Nun gibt es in der Schweiz für die Archivierung bestimmter elektronischer Dokumenttypen seit längerer Zeit gesetzliche Regelungen, doch gilt dies nicht für alle an einer Hochschule wichtigen Dokumente.

Wir brauchen also neue Ideen und Konzepte, wie und in welcher Form etwa der langfristige Zugang zu Forschungsdaten, elektronischen Zeitschrifteninhalten und elektronischen Büchern sichergestellt werden kann. Hier sind vor allem die hochschuleigenen Bibliotheken und Archive gefragt. Ihre Aufgabe ist es, entsprechende Strategien und Techniken zu entwickeln und zu implementieren und vor allem auch das Thema «Sicherung elektronischer Daten» in die Diskussion zu rücken.

Zumindest an der ETH Zürich wurden hierzu erste Schritte unternommen. Beispielhaft genannt sei hier etwa das Projekt Digitaler Datenerhalt, das die mittel- und langfristige Sicherung und Zugänglichkeit von Forschungsdaten an der Hochschule zum Ziel hat. Darüber hinaus gibt es erste Projekte, wie und mit welchen Methoden der langfristige Zugriff auf einmal lizenzierte elektronische Zeitschriften möglich sein könnte.

Allen Beteiligten sollte jedoch bereits heute klar sein, dass die Sicherung und langfristige Verfügbarkeit der unterschiedlichsten elektronischen Daten für jede Hochschule eine grosse Herausforderung darstellt. Auch die ETH Zürich steht hier erst am Anfang.

Zum Autor
Wolfram Neubauer ist der Direktor der ETH-Bibliothek. Neubauer wurde am 15. September 1950 in Rain/Lech (D) geboren. Er studierte Mineralogie und Chemie an der TU München und Universität München. Seine Doktorarbeit verfasste er in den Jahren 1979 und 1982 über ein geochemisches Thema am Mineralogisch-Petrografischen Institut der Universität München.Von 1981 bis 1983 absolvierte Neubauer eine postgraduale Ausbildung zum wissenschaftlichen Bibliothekar und war anschliessend für mehrere Jahre als Leiter der Bibliothek eines internationalen Pharmaunternehmens tätig. Bis Ende 1996 war er Leiter der Zentralbibliothek des Forschungszentrums Jülich, einer der grossen nationalen Forschungseinrichtungen Deutschlands. Seit dem 1. Januar 1997 ist er der Direktor der ETH-Bibliothek. Nebenberuflich ist er in verschiedenen Fachgremien tätig (u.a. Mitglied im Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme der DFG, Mitglied im Wissenschaftlichen Beirat des Deutschen Museums).

 
Leserkommentare: