Categories: CloudCloud-Management

AWS bietet Graviton2-basierte EC2-Instanzen für GPU-basierte Workloads

Amazon Web Services (AWS) hat die allgemeine Verfügbarkeit einer neuen Reihe von EC2-Instanzen angekündigt, einschließlich Graviton2-basierter Instanzen, die für GPU-basierte Arbeitslasten entwickelt wurden. Neben dem von Amazon speziell entwickelten Graviton2-Chip verfügen die Amazon EC2 G5g-Instanzen auch über Nvidia T4G Tensor Core-GPUs.

AWS hob einige Arbeitslasten hervor, für die die G5g-Instanzen gut geeignet sind: Für das Streaming von Android-Spielen bieten die Instanzen bis zu 30 Prozent niedrigere Kosten pro Stream und Stunde als x86-basierte GPU-Instanzen, so Amazon. Für ML-Inferenz sind G5g-Instanzen gut geeignet für Modelle, die empfindlich auf die CPU-Leistung reagieren oder die KI-Bibliotheken von Nvidia nutzen. Für das Grafik-Rendering sind G5g-Instanzen die kostengünstigste Option für AWS-Kunden.

Die Instanzen sind mit einer Reihe von Grafik- und Machine Learning-Bibliotheken unter Linux kompatibel, darunter NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS und TensorRT. Die G5g-Instanzen sind derzeit in den Regionen USA Ost (Nord-Virginia), USA West (Oregon) und Asien-Pazifik (Seoul, Singapur und Tokio) als On-Demand-, Spot-, Sparplan- und Reserved-Instanzen verfügbar.

AWS führt auch die EC2 M6a-Instanzen mit AMD Epyc-Prozessoren der 3. Generation ab sofort als allgemein verfügbar. Sie laufen mit Frequenzen von bis zu 3,6 GHz und bieten bis zu 35 Prozent mehr Leistung als die M5a-Instanzen der vorherigen Generation. Diese neuen Instanzen eignen sich gut für allgemeine Arbeitslasten wie Webserver, Anwendungsserver und kleine Datenspeicher.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

Google schließt kritische Sicherheitslücke in Android 14

Weitere schwerwiegende Fehler stecken in Android 12 und 13. Insgesamt bringt der Mai-Patchday 29 Fixes.

10 Stunden ago

IT Sicherheit: digitale Angriffe sicher abwehren

IT-Sicherheit - Erkennen und Abwehren von digitalen Angriffen

15 Stunden ago

Bestverkaufte Smartphones: Apple und Samsung dominieren

Das iPhone 15 Pro Max ist das meistverkaufte Smartphone im ersten Quartal. Das Galaxy S24…

18 Stunden ago

Google: Passkeys schützen mehr als 400 Millionen Google-Konten

Die Passwort-Alternative Passkeys überholt Einmalpasswörter bei der Zwei-Faktor-Authentifizierung. Auch Microsoft setzt sich aktiv für die…

1 Tag ago

Infostealer: 53 Prozent der Angriffe treffen Unternehmensrechner

Der Anteil steigt seit 2020 um 34 Prozentpunkte. Allein 2023 erfasst Kaspersky rund 10 Millionen…

1 Tag ago

Salesforce: Mit Einstein GPT zurück auf die Überholspur?

Salesforce forciert den Ausbau seiner Industry Clouds. Mit ihrem Prozesswissen könnten deutsche IT-Dienstleister davon profitieren.

2 Tagen ago