Categories: CloudCloud-Management

AWS bietet Graviton2-basierte EC2-Instanzen für GPU-basierte Workloads

Amazon Web Services (AWS) hat die allgemeine Verfügbarkeit einer neuen Reihe von EC2-Instanzen angekündigt, einschließlich Graviton2-basierter Instanzen, die für GPU-basierte Arbeitslasten entwickelt wurden. Neben dem von Amazon speziell entwickelten Graviton2-Chip verfügen die Amazon EC2 G5g-Instanzen auch über Nvidia T4G Tensor Core-GPUs.

AWS hob einige Arbeitslasten hervor, für die die G5g-Instanzen gut geeignet sind: Für das Streaming von Android-Spielen bieten die Instanzen bis zu 30 Prozent niedrigere Kosten pro Stream und Stunde als x86-basierte GPU-Instanzen, so Amazon. Für ML-Inferenz sind G5g-Instanzen gut geeignet für Modelle, die empfindlich auf die CPU-Leistung reagieren oder die KI-Bibliotheken von Nvidia nutzen. Für das Grafik-Rendering sind G5g-Instanzen die kostengünstigste Option für AWS-Kunden.

Die Instanzen sind mit einer Reihe von Grafik- und Machine Learning-Bibliotheken unter Linux kompatibel, darunter NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS und TensorRT. Die G5g-Instanzen sind derzeit in den Regionen USA Ost (Nord-Virginia), USA West (Oregon) und Asien-Pazifik (Seoul, Singapur und Tokio) als On-Demand-, Spot-, Sparplan- und Reserved-Instanzen verfügbar.

AWS führt auch die EC2 M6a-Instanzen mit AMD Epyc-Prozessoren der 3. Generation ab sofort als allgemein verfügbar. Sie laufen mit Frequenzen von bis zu 3,6 GHz und bieten bis zu 35 Prozent mehr Leistung als die M5a-Instanzen der vorherigen Generation. Diese neuen Instanzen eignen sich gut für allgemeine Arbeitslasten wie Webserver, Anwendungsserver und kleine Datenspeicher.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

2 Tagen ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

6 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

6 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

6 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

6 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago