Wegweisende Datenbank-Forschung
Jede grössere Software-Applikation basiert auf Datenbanken. Der ETH-Forscher Gustavo Alonso veröffentlichte vor zehn Jahren ein Paper zur Datenreplikation, das eine Kehrtwende in der Entwicklung leistungsstarker Datenbanksysteme bedeutete. Heute könnten jene Erkenntnisse zur Lösung des Datenschutz-Problems in der digitalen Gesellschaft beitragen.
Datenreplikation ist die Grundlage der digitalen Gesellschaft: Millionen von Menschen wollen rund um die Uhr und rund um den Globus auf Daten zugreifen, Daten verändern, Daten streuen. Um das zu ermöglichen, müssen sie laufend synchronisiert werden. Vor zehn Jahren gehörte die Datenreplikation noch zu den grossen Herausforderungen der Informationstechnologie.
Dass die grossen Datenbanken der Welt, auf denen jegliche Software und damit unser semidigitales Leben basiert, heute so aussehen, wie sie aussehen, ist auch der Verdienst von Gustavo Alonso, Informatik-Professor am Institut für Pervasive Computing der ETH Zürich. Im Jahr 2000 veröffentlichte er zusammen mit Bettina Kemme, damals Doktorandin an der ETH und heute Associate Professor an der McGill University in Montreal, ein Paper über Datenreplikation, das die bisherige Forschung in eine neue Richtung lenken sollte. Zu jener Zeit glaubte man noch, eine möglichst leistungsstarke Datenbank könne keine hohe Datenkonsistenz gewährleisten und vice versa. Alonso und Kemme wollten aber nicht an die Zukunft des sogenannten «lazy protocol» glauben, das einerseits die Konsistenz der Daten nur bedingt gewährleisten konnte und andererseits die Skalierbarkeit, also eine ressourceneffiziente Leistungssteigerung, erschwerte. Also begannen Sie an einer Lösung zu arbeiten, um die hohe Konsistenz des «eager protocol» mit einer besseren Performance und einer grösseren Skalierbarkeit kombinieren zu können.
Grundstein für Datenbanken
Und sie reüssierten: Ausschliesslich auf Basis bereits bekannter Prinzipien der Informationstechnologie konnten sie beweisen, dass sich Performance, Konsistenz und Skalierbarkeit nicht gegenseitig ausschliessen. «Unsere Arbeit stellte einen Durchbruch dar», sagt Alonso mehr als zehn Jahre später. Die Erkenntnisse seien eine sehr wichtige technische Weiterentwicklung für Datenbanken, welche den Grundstein jeder grösseren Software-Applikation bilden. Von Stolz zeugt auch der Titel des entsprechenden Papers, der mit den Worten «Don’t be lazy, be consistent» beginnt.
Kontrolle über alle persönlich relevanten Daten
Sähe die Digitalgesellschaft ohne Gustavo Alonsos Forschung heute ganz anders aus? Könnten etwa Datenbankriesen wie Facebook, YouTube oder Flickr gar nicht existieren? «Das würde ich nicht behaupten», sagt der 46-jährige Spanier. Aber: «Unsere Forschung erleichterte das Design von Datenmanagement-Systemen, die eine elementare Komponente solcher Services darstellen.» Dass die totale Datenmenge dieser Welt von Sekunde zu Sekunde grösser wird, stimmt Alonso nicht weiter nachdenklich. Er vertraut darauf, dass die Wissenschaft immer raffiniertere Wege findet, um Daten zu speichern und zu verarbeiten. Das grosse Problem bestehe hingegen darin, dass man als Individuum nicht mehr beurteilen kann, welche Informationen überhaupt relevant sind. «Aber daran können auch bessere Datenbanksysteme nichts ändern», so Alonso.
Trotzdem könnte eine sichere, flexible und effiziente Datenreplikation bald einen grossen Einfluss auf die Gesellschaft haben. Theoretisch ermöglicht dies nämlich jeder Person, ständig eine Kopie aller sie betreffenden Daten zu besitzen, unabhängig davon, wo diese ursprünglich angelegt sind. «Mit entsprechenden Rechtsgrundlagen könnten diese Kopien einen verbindlichen Status erlangen, was viele Datenschutz-Probleme lösen könnte», sagt Alonso.
Lohnende Grundlagenforschung
Die ETH solle unbedingt noch mehr in die Grundlagenforschung investieren, fährt der Forscher fort. Denn auch wenn daraus wenig lukrative Geschäftsmodelle entstünden, habe sich Grundlagenforschung «bisher noch immer ausbezahlt». Auf die Frage, weshalb Alonso Grundlagenforscher geworden ist, antwortet er mit Überzeugung: «Im Gegensatz zur kurzfristigen Forschung sind die Fragen in der Grundlagenforschung interessanter und die Auswirkungen grösser.»
Für ihre wegweisende Forschung durften Kemme und Alonso im September 2010 in Singapur den «10 Year Best Paper Award» der 36th International Conference on Very Large Data Bases in Empfang nehmen. Dieser Preis wird alljährlich für Arbeiten verliehen, die auf ein Jahrzehnt zurückblickend den grössten Einfluss auf Forschung und Industrie im Bereich der grossen Datenbanken hatten. Alonso ist nach Gerhard Weikum im Jahr 2002 und Hans-Jörg Schek im Jahr 2008 bereits der dritte Professor des Departements Informatik der ETH Zürich, der diese Ehrung erhält.
LESERKOMMENTARE