Categories: ForschungInnovation

Google Nima: Bildbewertung mit Hilfe künstlicher Intelligenz

Google hat mit Nima (Neural Image Assessment) ein künstliches neuronales Netz vorgestellt, das Bilder unter subjektiven und ästhetischen Gesichtspunkten bewertet. Es handelt sich um ein Deep Convolutional Neural Network (CNN) und damit ein von biologischen Prozessen inspiriertes Konzept maschinellen Lernens. Ein Deep CNN fällt dabei außerdem in den Bereich von Deep Learning.

Schon länger ist es möglich, die technische Qualität von Bildern einzuschätzen durch die Messung von Verschlechterungen auf Pixelebene, also etwa verschwommener Wiedergabe oder durch Kompression entstandener Artefakte. Damit blieben aber Eigenschaften außen vor, die mit Gefühlen und Schönheit im Auge des Betrachters verbunden sind – wie beispielsweise bei Landschaftsbildern der Fall.

Von Nima vorhergesagter Score und durchschnittliche Bewertung menschlicher Betrachter (Bild: Google mit AVA-Beispielbildern)

Deshalb kommen auch CNNs zum Einsatz, die mit bereits von Menschen bewerteten Bildern trainiert werden. Bislang wurden diese aber nur mit niedriger oder hoher Qualität kategorisiert. Die Google-Forscher sahen das jedoch als eingeschränkte Herangehensweise und gingen dazu über, mit einer Punktzahl zwischen 1 und 10 bewertete Bilder zu verwenden. Das so trainierte Nima-Modell soll nun in der Lage sein, einem jeden vorliegenden Bild einen wahrscheinlichen Score zuzuweisen, wie ihn auch Menschen vergeben würden.

Als Grundlage dienten Bilder aus einer Datenbank für Aesthetic Visual Analysis (AVA), die im Zusammenhang mit Fotowettbewerben von durchschnittlich 200 Menschen bewertet wurden. Damit trainiert konnte Nima eine ästhetische Einstufung der Bilder vornehmen, die dicht an die von kundigen menschlichen Betrachtern vergebene Punktzahl herankam.

Mit Hilfe von Nima optimierte Fotos und die vergebenen Scores (Bild: Google mit Testfotos von MIT-Adobe FiveK)

Laut Google erzielte Nima auch mit anderen Bildersammlungen vergleichbare Ergebnisse. Die Scores für technische und ästhetische Bildqualität ließen sich nun anwenden, um Bilder in wahrnehmbarer Weise zu verbessern. Das Modell sei so in der Lage, einen Deep-CNN-Filter zu bestimmen, der in ästhetischer Hinsicht fast optimale Einstellungen von Parametern wie Helligkeit, Glanzlichtern und Schatten erlaubt.

Die Google-Forscher hoffen auf eine breite Palette nützlicher Funktionen, die sich daraus ergeben könnten. „Wir könnten Nutzer beispielsweise in die Lage versetzen, auf einfache Weise die besten Bilder unter vielen zu finden“, schreiben sie in einem Blogeintrag. „Oder sogar verbesserte Aufnahmen ermöglichen, zu denen die Nutzer Feedback in Echtzeit erhalten. Bei der Nachbearbeitung könnten diese Modelle zur Bestimmung von Optimierungsparametern dienen, die zu wahrnehmbar besseren Ergebnissen führen.“

ZDNet.de Redaktion

Recent Posts

Salesforce: Mit Einstein GPT zurück auf die Überholspur?

Salesforce forciert den Ausbau seiner Industry Clouds. Mit ihrem Prozesswissen könnten deutsche IT-Dienstleister davon profitieren.

6 Stunden ago

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

Bisher unbekannter Bedrohungsakteur versucht über gefälschte IP Scanner Software-Domänen Zugriff auf IT-Umgebungen zu erlangen.

2 Tagen ago

BSI-Studie: Wie KI die Bedrohungslandschaft verändert

Der Bericht zeigt bereits nutzbare Angriffsanwendungen und bewertet die Risiken, die davon ausgehen.

2 Tagen ago

KI-Wandel: Welche Berufe sich am stärksten verändern

Deutsche sehen Finanzwesen und IT im Zentrum der KI-Transformation. Justiz und Militär hingegen werden deutlich…

2 Tagen ago

Wie ein Unternehmen, das Sie noch nicht kennen, eine Revolution in der Cloud-Speicherung anführt

Cubbit ist das weltweit erste Unternehmen, das Cloud-Objektspeicher anbietet. Es wurde 2016 gegründet und bedient…

3 Tagen ago

Dirty Stream: Microsoft entdeckt neuartige Angriffe auf Android-Apps

Unbefugte können Schadcode einschleusen und ausführen. Auslöser ist eine fehlerhafte Implementierung einer Android-Funktion.

3 Tagen ago