Amazon Web Services (AWS) hat die allgemeine Verfügbarkeit einer neuen Reihe von EC2-Instanzen angekündigt, einschließlich Graviton2-basierter Instanzen, die für GPU-basierte Arbeitslasten entwickelt wurden. Neben dem von Amazon speziell entwickelten Graviton2-Chip verfügen die Amazon EC2 G5g-Instanzen auch über Nvidia T4G Tensor Core-GPUs.
AWS hob einige Arbeitslasten hervor, für die die G5g-Instanzen gut geeignet sind: Für das Streaming von Android-Spielen bieten die Instanzen bis zu 30 Prozent niedrigere Kosten pro Stream und Stunde als x86-basierte GPU-Instanzen, so Amazon. Für ML-Inferenz sind G5g-Instanzen gut geeignet für Modelle, die empfindlich auf die CPU-Leistung reagieren oder die KI-Bibliotheken von Nvidia nutzen. Für das Grafik-Rendering sind G5g-Instanzen die kostengünstigste Option für AWS-Kunden.
Die Instanzen sind mit einer Reihe von Grafik- und Machine Learning-Bibliotheken unter Linux kompatibel, darunter NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS und TensorRT. Die G5g-Instanzen sind derzeit in den Regionen USA Ost (Nord-Virginia), USA West (Oregon) und Asien-Pazifik (Seoul, Singapur und Tokio) als On-Demand-, Spot-, Sparplan- und Reserved-Instanzen verfügbar.
AWS führt auch die EC2 M6a-Instanzen mit AMD Epyc-Prozessoren der 3. Generation ab sofort als allgemein verfügbar. Sie laufen mit Frequenzen von bis zu 3,6 GHz und bieten bis zu 35 Prozent mehr Leistung als die M5a-Instanzen der vorherigen Generation. Diese neuen Instanzen eignen sich gut für allgemeine Arbeitslasten wie Webserver, Anwendungsserver und kleine Datenspeicher.
Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…
Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…
Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.
2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…
Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…
NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.