Googles Bilderkennungssoftware Lens erkennt inzwischen über eine Milliarde Objekte. Diesen Fortschritt teilte Aparna Chennapragada, VP Google Lens & AR im Rahmen eines Blogbeitrags mit. Ihr zufolge erkannte Lens zur Vorstellung vor etwa einem Jahr nur gut 250 Millionen Objekte.
Laut Chennapragada sind die enormen Fortschritte durch die Lesefähigkeit von Lens zustande gekommen. Dies hat Google realisiert, indem es eine benutzerdefinierte OCR-Engine (Optical Character Recognition) mit seinen Sprachkenntnissen aus der Suche und seinem Knowledge Graph kombinierte.
Dank der OCR-Engine und des Trainings ist Lens sehr gut im Lesen von Produktetiketten und anderen Texten geworden, was ihm hilft, über eine Milliarde Produkte zu identifizieren. Um beispielsweise zwischen dem Buchstaben „o“ und einer Null zu unterscheiden, stützt er sich auf Rechtschreibkorrekturmodelle der Google-Suche.
„Wenn Computer anfangen zu sehen, wie wir es tun, wird die Kamera zu einer leistungsstarken und intuitiven Schnittstelle für die Welt um uns herum werden; ein KI-Sucher, der die Antworten genau dort findet, wo die Fragen die Richtungen direkt auf den Straßen überlagern, die wir gerade betreten, die Produkte, nach denen wir suchen, in den Verkaufsregalen hervorheben oder sofort jedes Wort vor uns in einer fremden Stadt übersetzen. Wir werden in der Lage sein, unsere Rechnungen zu bezahlen, unsere Parkuhren zu füttern und mehr über fast alles um uns herum zu erfahren, indem wir einfach die Kamera darauf ausrichten“, sagt Chennapragada.
Mit Bixby Vision bietet Samsung eine ähnliche Technik für seine Galaxy-Smartphones. Dort steht die Funktion in der Galerie- und Kamera-App zur Verfügung. Auf den Samsung-Geräten lässt sich aber auch Google Lens nutzen.
Probleme treten vor allem bei Nutzern von Outlook Web Access auf. Das optionale Hotfix-Update für…
Die Einladung zeigt einen zeichnenden Apple Pencil. Der wiederum deutet auf neue iPads hin. Es…
Die Richtlinie erhält 584 Ja-Stimmen und 3 Gegenstimmen. Das „Recht auf Reparatur“ beinhaltet unter bestimmten…
Die Tests basieren auf tatsächlich existierenden Sicherheitslücken. GPT-4 erreicht eine Erfolgsquote von 87 Prozent. Alle…
Vorstellung Im Jahr 2016 hat Marcus Krämer die Firma HostPress gegründet, da es zu diesem…
Die neue V-NAND-Generation bietet die derzeit höchste verfügbare Bit-Dichte. Samsung steigert auch die Geschwindigkeit und…