Veröffentlicht: 11.02.13
Science

«Statistik hilft, mit dem Zufall umzugehen»

2013 ist das Internationale Jahr der Statistik. ETH Life unterhielt sich mit Hans-Rudolf Künsch, Professor am Seminar für Statistik, über Geschichte und Gegenwart seines Fachgebiets und darüber, wo überall Statistik drinsteckt, wenn man es gar nicht erwarten würde.

Interview: Fabio Bergamin
«Statistik hat für mich viel mit Detektivarbeit zu tun», sagt Hans-Rudolf Künsch, Professor am Seminar für Statistik. (Bild: Giulia Marthaler / ETH Zürich)
«Statistik hat für mich viel mit Detektivarbeit zu tun», sagt Hans-Rudolf Künsch, Professor am Seminar für Statistik. (Bild: Giulia Marthaler / ETH Zürich) (Grossbild)

«Ich traue keiner Statistik, die ich nicht selbst gefälscht habe.» Dieses Zitat wird Winston Churchill in den Mund gelegt. Kann man Ihrer Meinung nach Statistiken trauen?
Sie sprechen das Missbrauchspotenzial von Statistiken an. Natürlich kann man auch mit zweifelhaften oder gar erfundenen Daten Statistik betreiben. Und mit tendenziösen grafischen Darstellungen kann man etwas suggerieren, was nicht den Tatsachen entspricht. An einem solchen Missbrauch ist allerdings nicht die Statistik schuld, sondern die Leute, die ihn treiben. Mit einem gewissen Fachwissen sind Missbräuche aber häufig zu entlarven. Auch in der Schule sollte daher ein Grundverständnis über Statistik vermittelt werden.

Was möchte man mit dem Internationalen Jahr der Statistik 2013 erreichen?
Viele Statistiker sind der Meinung, das öffentliche Bild ihres Fachgebiets sei etwas schief, mitunter negativ. Das möchten wir korrigieren. Missbräuche der Statistik sind dabei aber nur ein Aspekt.

Die Statistik wird manchmal als trockenes Fach, als Zahlenbeigerei wahrgenommen. Ist auch das ein Aspekt?
Ja. Viele Leute meinen, Statistik sei gleichzusetzen mit der Arbeit des Bundesamts für Statistik, und sie bestehe aus nichts anderem als dem Zählen von Apfelbäumen und Kühen in der Schweiz. Dieses Bild ist falsch. Statistik ist eine vielfältige Wissenschaft, die Methoden entwickelt, um aus zufällig schwankenden Daten Schlüsse zu ziehen.

Inwiefern ist die Statistik vielfältig?
Sie hat ihren Ursprung in der Mathematik, greift aber in viele Bereiche der modernen Wissenschaften über. Grosse Teile der Biologie, der Medizin, der Ingenieurwissenschaften und der Umweltforschung wären heute ohne Statistik undenkbar. Der Chefökonom von Google, Hal Varian, sagte vor vier Jahren: Der sexyeste Beruf des kommenden Jahrzehnts ist der des Statistikers.

Sind Sie mit Herrn Varian einig?
Auch für mich ist die Statistik ein enorm faszinierendes Gebiet, das mir grossen Spass macht. Statistik hat für mich viel mit Detektivarbeit zu tun: Es gilt, Zusammenhänge zu erkennen, die nicht offensichtlich sind.

Und warum soll Statistik gerade heute so attraktiv sein?
Gegenüber früher stehen uns heute viel mehr Daten zur Verfügung. Wir sprechen von Big Data, den grossen Datenmengen, die heute jeden Tag, ja jede Sekunde anfallen. Mithilfe der Statistik kann man aus diesen Daten interessantes Wissen extrahieren. Allerdings bedürfen diese grossen Datenmengen neuer statistischer Methoden. Das ist derzeit ein sehr aktives Forschungsfeld in der Statistik.

Worum geht es dabei?
Unter dem Stichwort «High-dimensional statistics» geht es beispielsweise um statistische Berechnungen mit einer sehr hohen Zahl an Variablen, typischerweise einer viel grösseren Zahl als jene der sogenannten Versuchseinheiten. In der Genetik stellen sich solche Fragen, etwa wenn man die Aktivitäten von mehreren tausend Genen bei einer begrenzten Anzahl von nur etwa hundert Patienten auswerten möchte.

Wir sind hier im Bereich der Life Sciences. Sie erwähnten vorher auch die Ingenieurswissenschaften. Wo steckt dort Statistik drin?
Ein typisches Beispiel, das vielen Leuten gar nicht bekannt sein dürfte: Spracherkennungsprogramme oder Programme, mit denen Roboter visuell ihre Umwelt erkennen können – Stichwort «Machine Learning» –, funktionieren nur mit Statistik. Auch da geht es um den Umgang mit Unsicherheiten und Variabilität. Eine Silbe oder ein Wort wird von jeder Person leicht anders ausgesprochen. Ein gutes System muss trotz diesen Variationen ein Wort oder einen Text erkennen können. Und ein Roboter wird kaum zweimal die genau gleiche Situation antreffen. Trotzdem muss er entscheiden können, ob eine angetroffene Situation einer gespeicherten Standardsituation ähnlich ist.

Der Anlass für das Jahr der Statistik gab offenbar ein berühmter Schweizer Mathematiker.
Ja, vor 300 Jahren wurde ein wichtiges Werk des Baslers Jakob Bernoulli veröffentlicht: Ars Conjectandi. Mit diesem Buch hat er die Wahrscheinlichkeitsrechnung und Statistik als mathematische Disziplin etabliert. Bernoulli untersuchte zunächst vor allem Glücksspiele wie das Würfeln. Er hat als erster das sogenannte Gesetz der grossen Zahlen bewiesen. Es besagt: Wenn man eine genügend grosse Zahl von wiederholten Beobachtungen macht, nähert sich die relative Häufigkeit eines Zufallsergebnisses seiner unbekannten Wahrscheinlichkeit beliebig genau an.

Ars Conjectandi – die Kunst der Vermutung oder Mutmassungen. Ist die Statistik die Wissenschaft der Mutmassungen?
Die Statistik muss als Wissenschaft mit den existierenden Unsicherheiten umgehen. Wegbringen kann sie sie nicht. Die Idee war damals, die Unsicherheiten zu quantifizieren, den Zufall zu mathematisieren. Auch heute geht es in der Statistik genau darum.

Was wünschen Sie sich 300 Jahre nach Bernoulli vom Jahr der Statistik?
Ich hoffe, es gelingt uns Statistikern, den Leuten zu zeigen, dass Statistik ein interessantes und wichtiges Gebiet ist. Der Zufall ist ja etwas, was viele Leute beschäftigt. Das Leben birgt viele Zufälle. Allerdings verhält es sich mit ihnen nicht immer so, wie man denkt oder wie man sie intuitiv beurteilt. Man ist häufig über Dinge erstaunt, die sich, wenn man sie genauer analysiert, als gar nicht so selten herausstellen. Dank der Statistik kann man besser mit dem Zufall umgehen.

Zur Person

Hans-Rudolf Künsch (61) ist Professor am Seminar für Statistik, einem Institut des Departements Mathematik. Einer seiner Forschungsschwerpunkte liegt auf dem Zusammenspiel von deterministischen und stochastischen Modellen. Damit sind Prozesse gemeint, die im Prinzip exakt vorhersagbar sind, bei denen aber trotzdem grosse Unsicherheiten bestehen, weil man die benötigten Anfangsbedingungen und Parameter zu wenig genau kennt. Ein Beispiel dafür sind Kurzzeitprognosen des Niederschlags, wo physikalische Modelle Punktvorhersagen liefern, aus denen man mit statistischen Methoden realistische Vorhersagebereiche ableiten kann. Ein anderes Beispiel sind Klimamodelle: Hier ist das Ziel, mit Hilfe der Statistik aus den unterschiedlichen Vorhersagen verschiedener Modelle eine adäquate Beschreibung der Unsicherheiten zu erhalten.

Das Internationale Jahr der Statistik wird in der Schweiz im Oktober 2013 mit einem internationalen Fachkongress zu Ehren Jakob Bernouillis Buch «Ars Conjectandi» begangen: www.statoo.ch/bernoulli13

 
Leserkommentare: