Nvidia: Rapids beschleunigt Datenanalyse und maschinelles Lernen

Auf der GPU Technology Conference in München hat Nvidia die quelloffenen Bibliotheken Rapids vorgestellt mit dem Versprechen, das Feld der Data Science voranzubringen. Sie sollen Nvidias CUDA-Plattform mit einer oder mehreren GPUs nutzen, um Datenanalyse und maschinelles Lernen zu beschleunigen.

CPU-Computing stößt an seine Grenzen, während sich die weltweite Datenmenge jährlich verdoppelt und das Mooresche Gesetz nicht mehr gilt, argumentiert Nvidia in einem Blogeintrag. Deshalb hätten sich wissenschaftliches Computing und Deep Learning der Nvidia-GPU-Beschleunigung zugewandt. Datenanalyse und maschinelles Lernen allerdings hätten sich die GPU-Leistung noch nicht systematisch erschließen können – was sich jetzt ändern soll. Rapids stelle erstmals eine robuste Plattform für GPU-beschleunigte Data Science bereit: Analyse, maschinelles Lernen und bald auch Datenvisualisierung.

Laut Nvidia zeigen erste Benchmarks eine 50-fache Beschleunigung im Vergleich zu Nur-CPU-Systemen, gemessen mit Rapids auf einem KI-System Nvidia DGX-2. Typische Trainingszeiten könnten demnach von Tagen auf Stunden oder von Stunden auf Minuten schrumpfen. Als eine praktische Anwendung führt Nvidia an, dass etwa Supermarktketten die optimale Lagermenge frischer Früchte für jeden Standort schätzen könnten. GPU-beschleunigte Analysen könnten Kreditinstitute frühzeitig auf das Risiko ausfallender Hypothekentilgungen aufmerksam machen.

Um die Voraussetzungen für Rapids zu schaffen, arbeiteten Nvidia-Ingenieure zwei Jahre lang mit Python-Entwicklern zusammen. Rapids baut auf Open-Source-Projekten einschließlich Apache Arrow, Pandas und Scikit-Learn auf. Es soll sich außerdem mit Apache Spark integrieren, dem von über tausend Organisationen eingesetzten Data-Science-Framework für Rechenzentren. Durch die quelloffenen Bibliotheken hofft der Hersteller außerdem auf weitere Fortschritte durch die Beiträge anderer Entwickler im Open-Source-Ökosystem.

Als Unterstützer von Rapids führt der Grafikspezialist, der sich zunehmend als KI-Pionier sieht, unter anderem Anaconda und Databricks an, das von den Spark-Schöpfern gegründete Unternehmen. Zu den Rapids-Partnern zählen außerdem Namen wie IBM, Hewlett Packard Enterprise und Oracle.

Die Open-Source-Bibliotheken stehen unter der Apache-Lizenz und auf Rapids.ai zum Download bereit. Container-Versionen von Rapids sollen in dieser Woche auf der NVIDIA GPU Cloud Container Registry folgen.

[mit Material von Andrew Brust, ZDNet.com]

Whitepaper

Studie zu Filesharing im Unternehmen: Kollaboration im sicheren und skalierbaren Umfeld

Im Rahmen der von techconsult im Auftrag von ownCloud und IBM durchgeführten Studie wurde das Filesharing in deutschen Unternehmen ab 500 Mitarbeitern im Kontext organisatorischer, technischer und sicherheitsrelevanter Aspekte untersucht, um gegenwärtige Zustände, Bedürfnisse und Optimierungspotentiale aufzuzeigen. Jetzt herunterladen!

Bernd Kling

Recent Posts

Sinequa-Marktbefragung in UK, Frankreich und Deutschland: In punkto DSGVO-Reife hält sich jeder für den Spitzenreiter

Zwei Jahre nach Inkrafttreten der EU-weiten DSGVO-Datenschutzbestimmungen hat der Anbieter kognitiver Such- und Analysesoftware eine Umfrage in drei europäischen Ländern…

22 Stunden ago

Ausprobiert: Rock Space WLAN Repeater AC1200

Der Rock Space WLAN Repeater AC1200 funkt mit 5 und 2,4 GHz. Die maximale Übertragungsrate beträgt 867 MBit/s. Bei 2,4…

2 Tagen ago

BSI veröffentlicht Sicherheitsanforderungen für Smartphones

Mit dem Forderungskatalog will das BSI einen öffentlichen Diskurs über Sicherheit von Smartphones starten. Die Anforderungen sollen zukünftig in Richtlinien…

2 Tagen ago

Update für Chrome schließt Zero-Day-Lücke

Mit Version 80.0.3987.122 schließt Google in Chrome drei Sicherheitslücken. Mit CVE-2020-6418 findet sich darunter auch eine Zero-Day-Lücke die aktiv ausgenutzt…

2 Tagen ago

Firefox: Mozilla aktiviert DNS-über-HTTPS für US-Nutzer

Durch die Verschlüsselung von DNS-Abfragen schützen sich Anwender vor dem Ausspionieren des Surfverhaltens. Anders als beim Google-Browser Chrome können Firefox-Nutzer…

2 Tagen ago

Opera R2020 mit verbessertem Tab-Management

Opera 67.0 alias R2020 soll mit seinem verbessertem Tab-Management für Ordnung beim Surfen sorgen. Tabs lassen sich in insgesamt fünf…

2 Tagen ago