Categories: KI

Nvidia stellt neue Generation seiner KI-Beschleunigerchips vor

Nvidia hat auf seiner Entwicklerkonferenz GTC 2024 eine neue Generation seiner GPU-basierten Beschleuniger-Chips für KI-Anwendungen vorgestellt. Der neue Chip B200 (Blackwell) hat mehr als doppelt so viele Transistoren wie sein Vorgänger H100 (Hopper).

„Hopper ist fantastisch, aber wir brauchen größere GPUs“, sagte Chief Executive Jensen Huang während seiner Keynote. Der B200 bietet eine Leistung von bis zu 20 Petaflops – der H100 bringt es auf 4 Petaflops. Das Leistungsplus soll es Unternehmen ermöglichen, größere und komplexere KI-Modelle zu entwickeln. Zudem enthält der neue Chip eine Transformer-Engine, die speziell für die Ausführung von Transformer-basierten KI-Modellen wie ChatGPT entwickelt wurde.

Laut Nvidia planen Cloud-Anbieter wie Amazon, Google, Microsoft und Oracle den Einsatz des GB200 Grace Blackwell Superchip, der zwei B200-GPUs zusammen mit einer ARM-basierten Grace-CPU enthält.

Amazon Web Services soll den Bau einer Server-Clusters mit 20.000 GB200-Chips in Angriff nehmen. Das System soll ein Modell mit 27 Billionen Parametern betreiben können. Modelle wie OpenAIs GPT-4 haben rund 1,7 Billionen Parameter.

Nvidia kündigte außerdem den Ausbau seines Softwaregeschäfts an. Ein neues Angebot namens NIM Inference Microservices soll Cloud-native Microservices für mehr als zwei Dutzend populäre Basismodelle bieten, einschließlich von Nvidia entwickelter Modelle. NIM ist so konzipiert, dass Benutzer KI-Modelle auf einer Reihe von Nvidia-Hardware betreiben können, die sie entweder lokal oder in der Cloud besitzen, und nicht auf die Anmietung von Kapazitäten bei einem dritten Cloud-Anbieter beschränkt sind.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

O2 und Telekom bauen Glasfaserkooperation aus

Beide Konzerne wollen die Zahl der Anschlüsse deutlich steigern. Die Öffnung des Telekomnetzes gilt ihnen…

24 Stunden ago

Cloud-Ausfälle: Wie oft sind Unternehmen betroffen?

Vier von fünf Betrieben in Deutschland nutzen Cloud Computing. 39 Prozent davon waren in den…

1 Tag ago

iFLYTEK stellt Spark V4.0 auf dem MWC Shanghai vor: Führend bei der nächsten KI-Welle

Shanghai, July 2024. iFLYTEK hielt in Peking eine große Pressekonferenz ab, um den mit Spannung…

1 Tag ago

Apple startet Beta von Karten im Web

Die Webversion unterstützt macOS, iPadOS (Chrome und Safari) und Windows (Chrome und Edge). Weitere Plattformen…

1 Tag ago

Bundesverwaltung beschafft bis zu 300.000 Apple-Geräte

Auftragnehmer ist der Neckarsulmer IT-Dienstleister Bechtle. Die Rahmenvereinbarung gilt bis 2027 und hat einen Wert…

1 Tag ago

Windows 11: Juli-Sicherheitspatches verursachen Probleme mit Bitlocker

Windows-Clients und -Server starten unter Umständen nur bis zum BitLocker-Wiederherstellungsbildschirm. Betroffen sind alle unterstützten Versionen…

2 Tagen ago