Categories: InnovationSoftware

Realistische Mimik statt stures Starren

93 Prozent unserer Kommunikation sind nonverbal, sagt Psychologe Professor Albert Mehrabian. Dabei sind Blickkontakt und Mimik der wichtigste Bestandteil. Bei Videocalls ging dieser Blickkontakt bisher verloren. Die KI-Software des Startups Casablanca erzeugt in Echtzeit Blickkontakt und realistische Mimik in Videocalls. Sie lässt sich mit allen Videocall-Systemen anwenden.

Digitaler Blickkontakt wie im analogen Gespräch

Für die Entwicklung hat das deutsche Startup zwei Jahre geforscht und drei Patente entwickelt. Herausgekommen ist eine Technologie, die mittels KI den natürlichen Blickkontakt wieder herstellt – allerdings nur, wenn man sich auch wirklich anschaut. Die Software arbeitet, als hätte man eine Kamera mitten auf dem Bildschirm angebracht – nur ohne die störende Kamera.

Bisherige Lösungen drehen lediglich die Augen zur Kamera – und zwar ständig, auch wenn der Gesprächspartner eigentlich den Blick abwendet. Das schafft zwar Blickkontakt, dieser ist allerdings sehr unnatürlich. Casablanca ist hingegen in der Lage, das ganze Gesicht zu verarbeiten. Dadurch wird der Kopf im idealen Winkel ausgerichtet und die KI erlaubt es auch, bewusst in eine andere Richtung zu schauen. Augenkontakt entsteht dadurch genau so, wie er auch im analogen Gespräch entstehen würde.

Natürliche Mimik dank Künstlicher Intelligenz

In Casablanca stecken verschiedene Technologien: Einerseits erzeugt die KI ein 3D-Abbild des Kopfes mit einem eigens entwickelten Deep-Learning-Verfahren. Ergänzend wird ein um zusätzliche Diskriminatoren erweitertes GAN (Generative Adversarial Network) eingesetzt, um fehlende Bildteile zu ergänzen. So kann beispielsweise der Hals rekonstruiert werden, wenn die Kamera diesen nicht erfassen kann. Erst diese Kombination ermöglicht die realistische Ausrichtung des Kopfes, natürlichen Blickkontakt und authentische Mimik. Andererseits sorgen neue Interpolationsverfahren dafür, dass Casablanca weniger Daten behandeln muss, um die Bilddrehung zu vollziehen – das sichert eine flüssige Anwendung in Echtzeit.

Die Lösung lässt sich mit allen Videocall-Systemen anwenden, denn es wird tatsächlich als (virtuelle) Kamera installiert, obwohl es reine Software ist. Man wählt dann in Zoom, Teams usw. statt der „Front Camera“ einfach die „Casablanca Camera“ aus. Edie Software benötigt allerdings auf Windows-Notebooks eine Grafikkarte für die KI-Berechnungen. Auf einem Mac mit M1 oder M2 Prozessor läuft die Software problemlos, da diese Prozessoren bereits die erforderliche KI-Rechenleistung mitbringen. Casablanca ist derzeit im Beta-Stadium, man kann sich kostenlos registrieren und die Beta-Version in allen Videocalls nutzen.

Roger Homrich

Recent Posts

Deckenmikrofon-Lautsprecher-Lösung für AV-Konferenzen

Audiolösung für Konferenzräume vereint Mikrofon-, Lautsprecher- und DSP-Technologie in einem Gerät.

5 Stunden ago

Die Auswirkungen der künstlichen Intelligenz auf die Übersetzungsbranche

Künstliche Intelligenz hat sich als sehr nützliches Werkzeug für die Entwicklung einer effektiveren maschinellen Übersetzung…

7 Stunden ago

Chrome 114: Google schließt 16 Sicherheitslücken

Acht Anfälligkeiten gelten als besonders schwerwiegend. Sie stecken unter anderem in der JavaScript-Engine und im…

20 Stunden ago

Firefox beendet Support für Windows 7 und 8 im September 2024

Den Support gewährt Mozilla ab Firefox 115 nur noch über das Extended Support Release. Die…

20 Stunden ago

Check Point erweitert Cloud-Firewall um Schutz für Microsoft Azure Virtual WAN

CloudGuard Network Security lässt sich nahtlos in den Azure Virtual WAN Hub integrieren.

1 Tag ago

No-Code oder Low-Code? Unterschiede sind kleiner als gedacht

Für eine neue gemeinsame Bezeichnung der beiden Technologien, plädiert Gastautor Tino Fliege von OutSystems.

1 Tag ago