Categories: CloudCloud-Management

AWS bietet Graviton2-basierte EC2-Instanzen für GPU-basierte Workloads

Amazon Web Services (AWS) hat die allgemeine Verfügbarkeit einer neuen Reihe von EC2-Instanzen angekündigt, einschließlich Graviton2-basierter Instanzen, die für GPU-basierte Arbeitslasten entwickelt wurden. Neben dem von Amazon speziell entwickelten Graviton2-Chip verfügen die Amazon EC2 G5g-Instanzen auch über Nvidia T4G Tensor Core-GPUs.

AWS hob einige Arbeitslasten hervor, für die die G5g-Instanzen gut geeignet sind: Für das Streaming von Android-Spielen bieten die Instanzen bis zu 30 Prozent niedrigere Kosten pro Stream und Stunde als x86-basierte GPU-Instanzen, so Amazon. Für ML-Inferenz sind G5g-Instanzen gut geeignet für Modelle, die empfindlich auf die CPU-Leistung reagieren oder die KI-Bibliotheken von Nvidia nutzen. Für das Grafik-Rendering sind G5g-Instanzen die kostengünstigste Option für AWS-Kunden.

Die Instanzen sind mit einer Reihe von Grafik- und Machine Learning-Bibliotheken unter Linux kompatibel, darunter NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS und TensorRT. Die G5g-Instanzen sind derzeit in den Regionen USA Ost (Nord-Virginia), USA West (Oregon) und Asien-Pazifik (Seoul, Singapur und Tokio) als On-Demand-, Spot-, Sparplan- und Reserved-Instanzen verfügbar.

AWS führt auch die EC2 M6a-Instanzen mit AMD Epyc-Prozessoren der 3. Generation ab sofort als allgemein verfügbar. Sie laufen mit Frequenzen von bis zu 3,6 GHz und bieten bis zu 35 Prozent mehr Leistung als die M5a-Instanzen der vorherigen Generation. Diese neuen Instanzen eignen sich gut für allgemeine Arbeitslasten wie Webserver, Anwendungsserver und kleine Datenspeicher.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

15 Stunden ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

17 Stunden ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

17 Stunden ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

21 Stunden ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

21 Stunden ago

Latrodectus: Gefährlicher Nachfolger von IcedID

Latrodectus, auch bekannt als BlackWidow, ist auch unter dem Namen LUNAR SPIDER bekannt.

22 Stunden ago