Categories: InnovationSoftware

Realistische Mimik statt stures Starren

93 Prozent unserer Kommunikation sind nonverbal, sagt Psychologe Professor Albert Mehrabian. Dabei sind Blickkontakt und Mimik der wichtigste Bestandteil. Bei Videocalls ging dieser Blickkontakt bisher verloren. Die KI-Software des Startups Casablanca erzeugt in Echtzeit Blickkontakt und realistische Mimik in Videocalls. Sie lässt sich mit allen Videocall-Systemen anwenden.

Digitaler Blickkontakt wie im analogen Gespräch

Für die Entwicklung hat das deutsche Startup zwei Jahre geforscht und drei Patente entwickelt. Herausgekommen ist eine Technologie, die mittels KI den natürlichen Blickkontakt wieder herstellt – allerdings nur, wenn man sich auch wirklich anschaut. Die Software arbeitet, als hätte man eine Kamera mitten auf dem Bildschirm angebracht – nur ohne die störende Kamera.

Bisherige Lösungen drehen lediglich die Augen zur Kamera – und zwar ständig, auch wenn der Gesprächspartner eigentlich den Blick abwendet. Das schafft zwar Blickkontakt, dieser ist allerdings sehr unnatürlich. Casablanca ist hingegen in der Lage, das ganze Gesicht zu verarbeiten. Dadurch wird der Kopf im idealen Winkel ausgerichtet und die KI erlaubt es auch, bewusst in eine andere Richtung zu schauen. Augenkontakt entsteht dadurch genau so, wie er auch im analogen Gespräch entstehen würde.

Natürliche Mimik dank Künstlicher Intelligenz

In Casablanca stecken verschiedene Technologien: Einerseits erzeugt die KI ein 3D-Abbild des Kopfes mit einem eigens entwickelten Deep-Learning-Verfahren. Ergänzend wird ein um zusätzliche Diskriminatoren erweitertes GAN (Generative Adversarial Network) eingesetzt, um fehlende Bildteile zu ergänzen. So kann beispielsweise der Hals rekonstruiert werden, wenn die Kamera diesen nicht erfassen kann. Erst diese Kombination ermöglicht die realistische Ausrichtung des Kopfes, natürlichen Blickkontakt und authentische Mimik. Andererseits sorgen neue Interpolationsverfahren dafür, dass Casablanca weniger Daten behandeln muss, um die Bilddrehung zu vollziehen – das sichert eine flüssige Anwendung in Echtzeit.

Die Lösung lässt sich mit allen Videocall-Systemen anwenden, denn es wird tatsächlich als (virtuelle) Kamera installiert, obwohl es reine Software ist. Man wählt dann in Zoom, Teams usw. statt der „Front Camera“ einfach die „Casablanca Camera“ aus. Edie Software benötigt allerdings auf Windows-Notebooks eine Grafikkarte für die KI-Berechnungen. Auf einem Mac mit M1 oder M2 Prozessor läuft die Software problemlos, da diese Prozessoren bereits die erforderliche KI-Rechenleistung mitbringen. Casablanca ist derzeit im Beta-Stadium, man kann sich kostenlos registrieren und die Beta-Version in allen Videocalls nutzen.

Roger Homrich

Recent Posts

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

Bisher unbekannter Bedrohungsakteur versucht über gefälschte IP Scanner Software-Domänen Zugriff auf IT-Umgebungen zu erlangen.

20 Stunden ago

BSI-Studie: Wie KI die Bedrohungslandschaft verändert

Der Bericht zeigt bereits nutzbare Angriffsanwendungen und bewertet die Risiken, die davon ausgehen.

2 Tagen ago

KI-Wandel: Welche Berufe sich am stärksten verändern

Deutsche sehen Finanzwesen und IT im Zentrum der KI-Transformation. Justiz und Militär hingegen werden deutlich…

2 Tagen ago

Wie ein Unternehmen, das Sie noch nicht kennen, eine Revolution in der Cloud-Speicherung anführt

Cubbit ist das weltweit erste Unternehmen, das Cloud-Objektspeicher anbietet. Es wurde 2016 gegründet und bedient…

2 Tagen ago

Dirty Stream: Microsoft entdeckt neuartige Angriffe auf Android-Apps

Unbefugte können Schadcode einschleusen und ausführen. Auslöser ist eine fehlerhafte Implementierung einer Android-Funktion.

2 Tagen ago

Apple meldet Umsatz- und Gewinnrückgang im zweiten Fiskalquartal

iPhones und iPads belasten das Ergebnis. Außerdem schwächelt Apple im gesamten asiatischen Raum inklusive China…

2 Tagen ago