Googles Bilderkennungssoftware Lens erkennt inzwischen über eine Milliarde Objekte. Diesen Fortschritt teilte Aparna Chennapragada, VP Google Lens & AR im Rahmen eines Blogbeitrags mit. Ihr zufolge erkannte Lens zur Vorstellung vor etwa einem Jahr nur gut 250 Millionen Objekte.
Laut Chennapragada sind die enormen Fortschritte durch die Lesefähigkeit von Lens zustande gekommen. Dies hat Google realisiert, indem es eine benutzerdefinierte OCR-Engine (Optical Character Recognition) mit seinen Sprachkenntnissen aus der Suche und seinem Knowledge Graph kombinierte.
Dank der OCR-Engine und des Trainings ist Lens sehr gut im Lesen von Produktetiketten und anderen Texten geworden, was ihm hilft, über eine Milliarde Produkte zu identifizieren. Um beispielsweise zwischen dem Buchstaben „o“ und einer Null zu unterscheiden, stützt er sich auf Rechtschreibkorrekturmodelle der Google-Suche.
„Wenn Computer anfangen zu sehen, wie wir es tun, wird die Kamera zu einer leistungsstarken und intuitiven Schnittstelle für die Welt um uns herum werden; ein KI-Sucher, der die Antworten genau dort findet, wo die Fragen die Richtungen direkt auf den Straßen überlagern, die wir gerade betreten, die Produkte, nach denen wir suchen, in den Verkaufsregalen hervorheben oder sofort jedes Wort vor uns in einer fremden Stadt übersetzen. Wir werden in der Lage sein, unsere Rechnungen zu bezahlen, unsere Parkuhren zu füttern und mehr über fast alles um uns herum zu erfahren, indem wir einfach die Kamera darauf ausrichten“, sagt Chennapragada.
Mit Bixby Vision bietet Samsung eine ähnliche Technik für seine Galaxy-Smartphones. Dort steht die Funktion in der Galerie- und Kamera-App zur Verfügung. Auf den Samsung-Geräten lässt sich aber auch Google Lens nutzen.
Beide Konzerne wollen die Zahl der Anschlüsse deutlich steigern. Die Öffnung des Telekomnetzes gilt ihnen…
Vier von fünf Betrieben in Deutschland nutzen Cloud Computing. 39 Prozent davon waren in den…
Shanghai, July 2024. iFLYTEK hielt in Peking eine große Pressekonferenz ab, um den mit Spannung…
Die Webversion unterstützt macOS, iPadOS (Chrome und Safari) und Windows (Chrome und Edge). Weitere Plattformen…
Auftragnehmer ist der Neckarsulmer IT-Dienstleister Bechtle. Die Rahmenvereinbarung gilt bis 2027 und hat einen Wert…
Windows-Clients und -Server starten unter Umständen nur bis zum BitLocker-Wiederherstellungsbildschirm. Betroffen sind alle unterstützten Versionen…