Veröffentlicht: 27.08.13
Science

Endlich Blickkontakt beim Skypen

Wen grosse Distanzen von Freunden und Familie trennen, nutzt oft Dienste für Videokonferenzen wie Skype, um sich gegenseitig beim Telefonieren auch zu sehen. Aber wer kennt nicht die leise Frustration, dass das Gegenüber einen dabei nicht direkt anschaut? Abhilfe schaffen könnte ein Software-Prototyp aus dem Labor für Computergraphik der ETH Zürich.

Angelika Jacobs
Eine neuartige Software dreht bei Videokonferenzen das Gesicht des Gegenübers, um den Blickkontakt herzustellen. (Bild: Labor für Computergrafik / ETH Zürich)
Eine neuartige Software dreht bei Videokonferenzen das Gesicht des Gegenübers, um den Blickkontakt herzustellen. (Bild: Labor für Computergrafik / ETH Zürich) (Grossbild)

«Wir möchten Videokonferenzen einem realen Treffen so ähnlich wie möglich machen», erklärt Claudia Kuster, Doktorandin am Labor für Computergraphik der ETH Zürich. Ein grosses Hindernis für das «echte» Gesprächs-Feeling sei der fehlende Blickkontakt. Das Problem entsteht dadurch, dass die Gesprächspartner meist das Bild ihres Gegenübers auf dem Bildschirm anschauen, anstatt sich an die Kamera zu richten. Kuster und ihre Kollegen bieten nun eine alltagstaugliche Lösung für das Problem: Eine Software, die das Gesicht im Video erkennt und es so dreht, dass die Person in die Kamera zu blicken scheint.

Bisher konnten sich nur grössere Unternehmen den Luxus leisten, bei Videokonferenzen den Blickkontakt künstlich herzustellen. Dazu benötigte man nämlich komplexe Spiegelsysteme oder gleich mehrere Kameras sowie spezielle Software. Für den privaten Gebrauch gab es keine zufriedenstellende Lösung des Problems.

Mit Tiefenkarte und Gesichtserkennung

Dies ändert sich nun dank der neuen Software, die Kuster unter Leitung von Markus Gross, Professor für Informatik an der ETH Zürich, entwickelt hat. Möglich wird das System für den Hausgebrauch dank der Kinect, einer neuen Generation von Kameras, welche gleichzeitig Farb- und Tiefeninformationen sammeln. Die von Kuster entwickelte Software nutzt die aus den Bildinformationen errechnete Tiefenkarte und ein Programm, das in Echtzeit Gesichter in Videos erkennt.

Im Gegensatz zu bisherigen Lösungsansätzen, verzichteten Kuster und ihre Kollegen darauf, das gesamte Videobild, inklusive Hintergrund, zu drehen. Damit umgehen sie das Problem, dass Informationen zu im Originalbild verdeckten Bildbereichen fehlen und sich beim gedrehten Bild somit Löcher ergäben. Stattdessen dreht ihr Algorithmus nur das Gesicht und fügt es nahtlos in das Originalbild ein. Dabei sucht die Software einen Umriss um das Gesicht, bei dem jeder Randpixel im Original und der entsprechende Pixel im gedrehten Bild möglichst ähnliche Farbwerte aufweisen.

Robust unter widrigen Bedingungen

«Die Software lässt sich in wenigen Schritten auf den Benutzer einstellen und läuft sehr robust», sagt Kuster. Verliert das Programm das Gesicht zeitweilig aus den Augen, zum Beispiel wenn die Person den Kopf dreht oder hinter einem Objekt wie einer Tasse verschwindet, belässt die Software das Bild im Original. Mit sich ändernden Lichtverhältnissen und sogar mit zwei Gesichtern gleichzeitig kann die Software mühelos umgehen, wie die Forschenden in einem Video demonstrieren. Allerdings behindert eine Brille die Gesichtserkennung in der aktuellen Version der Software, so dass Brillenträger die Sehhilfe bei Videokonferenzen beiseitelegen müssten.

Obwohl die neue Generation von Kameras mit Tiefensensor erschwinglich sind, liegen sie preislich doch über dem Durchschnitt herkömmlicher Webcams. Ausserdem sind aktuelle Laptops, Tablets oder Smartphones noch nicht mit dieser Technologie ausgestattet. Auch deshalb planen Kuster und ihre Kollegen, die Software für mobile Geräte mit herkömmlichen Webcams weiterzuentwickeln und möglichst für die Nutzer weiter zu vereinfachen. Schliesslich möchten die Forschenden auch ein Skype-Plugin entwickeln, welches Benutzer einfach installieren können, um künftig mit Blickkontakt zu skypen.

Literaturhinweis:

Kuster C, Popa T, Bazin JC, Gotsman C, Gross M: Gaze Correction for Home Video Conferencing. Proceedings of ACM SIGGRAPH Asia (Singapore, November 28 - December 1, 2012), ACM Transactions on Graphics, 31 (6), 174:1-174:6

 
Leserkommentare:
Wir sind an Ihrer Meinung interessiert. Bitte schreiben Sie uns: