Veröffentlicht: 10.03.09
IBM Faculty Award für Nesime Tatbul

Datenströme schneller verarbeiten

Die Verarbeitung von Datenströmen wird immer anspruchsvoller und wichtiger. Für ihre Arbeit auf dem Gebiet des Data Stream Management erhält Nesime Tatbul, Professorin für Advanced Data Management Systems am Departement Informatik der ETH Zürich, den mit 40‘000 US-Dollar dotierten IBM Faculty Award. Im Rahmen eines gemeinsamen Projektes mit IBM wird sie untersuchen, wie Hardwarekomponenten dazu beitragen können, Datenströme schneller zu prozessieren.

Nicole Kasielke
Udo Hertz, Director of Information Management Development, IBM Research & Development GmbH Böblingen, übergibt Nesime Tabul den mit 40‘000 US-Dollar dotierten Preis (Foto: Katja Abrahams, D-INFK).
Udo Hertz, Director of Information Management Development, IBM Research & Development GmbH Böblingen, übergibt Nesime Tabul den mit 40‘000 US-Dollar dotierten Preis (Foto: Katja Abrahams, D-INFK). (Galerie)

Meist machen wir uns keine Gedanken darüber, wie Datenströme verarbeitet werden. Hauptsache die Anzeigentafel an der Haltestelle zeigt richtig an, wann das nächste Tram kommt. Die Verarbeitung von Ortsinformationen ist aber nur eine von vielen Anwendungen von Data Stream Management-Systemen in unserem Alltag. Weitere Einsatzgebiete sind unter anderem der elektronische Wertpapierhandel, die Überwachung von öffentlichen Plätzen, die Qualitätskontrolle und Steuerung von Produktionsanlagen oder die Überwachung der Wasserqualität von Flüssen. Auch wissenschaftliche Anwendungen wie die Datenstrom-Analyse des Large Hadron Colliders (LHC) am CERN gehören dazu.

Diese stetige Weiterentwicklung von Sensor-Netzwerken geht mit einem steigenden Anspruch an das Prozessieren von grossen Datenmengen einher. „Im Data Management hat es in den letzten Jahren einen Paradigmenwechsel gegeben“, erklärt Nesime Tatbul. „Früher wurden Daten zuerst in einer Datenbank gespeichert und dann auf Verlangen wieder herausgesucht. Heute werden Datenströme häufig in Echtzeit verarbeitet.“ Data Stream Management muss deshalb andere Anforderungen erfüllen als das traditionelle Data Management.

Hard- und Software: gemeinsam zum Erfolg

Die Herausforderung beim Data Stream Management liegt in der schnellen Verarbeitung der grossen Datenmengen. In einem aktuellen Projekt Tatbuls mit der Credit Suisse geht es zum Beispiel darum, Informationen von Optionsbörsen optimal auszuwerten. Dabei handelt es sich um Datenvolumen im Bereich von hunderttausenden von Informationen pro Sekunde. Kann die Verzögerung bei der Bearbeitung solcher Informationen um ein paar Millisekunden reduziert werden, hat dies bereits einen signifikanten Einfluss auf den Profit.

Eine schnellere Verarbeitung kann aber nur über ein besseres Zusammenspiel von Hard- und Software erreicht werden. Eine wichtige Rolle spielen dabei sogenannte Field Programmable Gate Arrays (FPGA). Diese Hardwarekomponenten können im Gegensatz zu den in Computern verwendeten Chips immer wieder neu programmiert werden. Dadurch können eigentliche Software-Funktionen bereits von der Hardware übernommen werden. Ausserdem ermöglichen FPGAs ein paralleles Prozessieren von Programmen und damit eine beschleunigte Datenverarbeitung. Neben FPGAs existieren auch noch andere Hardwareplattformen, die für solche Anwendungen in Frage kommen. Für Tatbul ist klar, dass die Zukunft darin liegt, Hard-und Software gemeinsam zu entwickeln und nicht wie bisher die Software auf bestehende Hardware aufzusetzen. „Dies erfordert von uns Software-Programmierern ein Umdenken und Umlernen“, betont Tatbul.

Gute Zusammenarbeit mit IBM

Mit dem Preisgeld von IBM wird Tatbul im Rahmen eines gemeinsamen Projektes  genau an diesen Aufgaben arbeiten. Sie werden die Möglichkeiten verschiedener Hardwarekomponenten testen, um die Verarbeitung von Datenströmen zu beschleunigen. Für Tatbul ist der Austausch mit IBM bei diesem Projekt entscheidend: „Die Zukunft der High-Performance Data Stream Management Systeme liegt in der gelungenen Kombination von Hard- und Software. Durch die Zusammenarbeit mit IBM gewinnen mein Team und ich die Möglichkeit, unser Wissen über Software mit ihrer Expertise im Hardwarebereich zu verbinden. Davon profitieren beide Seiten.“ Der Austausch mit IBM sei sehr intensiv, betont Tatbul. Erst letzten Sommer habe ein Masterstudent von ihr einen Forschungsaufenthalt bei IBM Böblingen verbracht und dort an einem FPGA-Projekt gearbeitet. „Die Expertise, die er dort erlangt hat, bringt er jetzt hier in unsere Arbeit ein.“ Auch in gemeinsamen Workshops tauschen sich die Forschenden aus Industrie und Wissenschaft regelmässig aus.

Intensive Kooperationen mit der Industrie – ein erfolgreiches Konzept

Die Zusammenarbeit mit IBM ist nur eine von mehreren Industrie-Kooperationen von Tatbul. Denn im Bereich des Data Management ist der Input der Industrie unerlässlich. Aus diesem Grund haben Tatbul und ihre Kollegen Donald Kossmann, Gustavo Alonso und Timothy Roscoe, mit denen zusammen sie die Systems Group bildet, das Enterprise Computing Center (ECC) gegründet. Als Enterprise Computing wird der Umgang mit grossen Datenmengen, die spezifisch auf die Bedürfnisse von Firmen und Organisationen angepasst werden müssen, bezeichnet. Für dieses Gebiet gibt es weltweit einen grossen Bedarf.

Als Industriepartner sind momentan Amadeus, SAP und Credit Suisse im ECC engagiert. Solche engen und langfristigen Kooperationen zwischen Industriepartnern und der ETH Zürich sollen helfen, die hochkomplexe Verarbeitung von grossen Datenmengen zu optimieren. Der Reiz des Data Managements liegt für Tatbul genau darin, dass es in so vielen unterschiedlichen Anwendungsbereichen zum Einsatz kommt. „ Für mich ist der Bezug zur praktischen Anwendung sehr wichtig. Die Möglichkeit, mit meiner Arbeit verschiedenste Bereiche zu beeinflussen, war einer der Hauptgründe für mich, Informatik zu studieren“, betont Tatbul.

 
Leserkommentare:
Wir sind an Ihrer Meinung interessiert. Bitte schreiben Sie uns: