Googles Bilderkennungssoftware Lens erkennt inzwischen über eine Milliarde Objekte. Diesen Fortschritt teilte Aparna Chennapragada, VP Google Lens & AR im Rahmen eines Blogbeitrags mit. Ihr zufolge erkannte Lens zur Vorstellung vor etwa einem Jahr nur gut 250 Millionen Objekte.
Laut Chennapragada sind die enormen Fortschritte durch die Lesefähigkeit von Lens zustande gekommen. Dies hat Google realisiert, indem es eine benutzerdefinierte OCR-Engine (Optical Character Recognition) mit seinen Sprachkenntnissen aus der Suche und seinem Knowledge Graph kombinierte.
Dank der OCR-Engine und des Trainings ist Lens sehr gut im Lesen von Produktetiketten und anderen Texten geworden, was ihm hilft, über eine Milliarde Produkte zu identifizieren. Um beispielsweise zwischen dem Buchstaben „o“ und einer Null zu unterscheiden, stützt er sich auf Rechtschreibkorrekturmodelle der Google-Suche.
„Wenn Computer anfangen zu sehen, wie wir es tun, wird die Kamera zu einer leistungsstarken und intuitiven Schnittstelle für die Welt um uns herum werden; ein KI-Sucher, der die Antworten genau dort findet, wo die Fragen die Richtungen direkt auf den Straßen überlagern, die wir gerade betreten, die Produkte, nach denen wir suchen, in den Verkaufsregalen hervorheben oder sofort jedes Wort vor uns in einer fremden Stadt übersetzen. Wir werden in der Lage sein, unsere Rechnungen zu bezahlen, unsere Parkuhren zu füttern und mehr über fast alles um uns herum zu erfahren, indem wir einfach die Kamera darauf ausrichten“, sagt Chennapragada.
Mit Bixby Vision bietet Samsung eine ähnliche Technik für seine Galaxy-Smartphones. Dort steht die Funktion in der Galerie- und Kamera-App zur Verfügung. Auf den Samsung-Geräten lässt sich aber auch Google Lens nutzen.
Unternehmen greifen von überall aus auf die Cloud und Applikationen zu. Dementsprechend reicht das Burg-Prinzip…
Hacker nutzen eine jetzt gepatchte Schwachstelle im Google-Browser bereits aktiv aus. Die neue Chrome-Version stopft…
Microsoft bietet seit Anfang der Woche einen Patch für die Lücke. Kaspersky-Forscher gehen davon aus,…
Das jüngste Update bringt insgesamt zwölf Fixes. Schadcode lässt sich unter Umständen ohne Interaktion mit…
Eine softwarebasierte Workstation soll es Ingenieuren erlauben, sämtliche Steuerungen zentral zu verwalten. Pilotkunde ist Ford.
Kryptodiebstahl und finanzieller Gewinn sind laut ESET-Forschungsbericht die vorrangigen neuen Ziele.