Amazon Web Services (AWS) hat die allgemeine Verfügbarkeit einer neuen Reihe von EC2-Instanzen angekündigt, einschließlich Graviton2-basierter Instanzen, die für GPU-basierte Arbeitslasten entwickelt wurden. Neben dem von Amazon speziell entwickelten Graviton2-Chip verfügen die Amazon EC2 G5g-Instanzen auch über Nvidia T4G Tensor Core-GPUs.
AWS hob einige Arbeitslasten hervor, für die die G5g-Instanzen gut geeignet sind: Für das Streaming von Android-Spielen bieten die Instanzen bis zu 30 Prozent niedrigere Kosten pro Stream und Stunde als x86-basierte GPU-Instanzen, so Amazon. Für ML-Inferenz sind G5g-Instanzen gut geeignet für Modelle, die empfindlich auf die CPU-Leistung reagieren oder die KI-Bibliotheken von Nvidia nutzen. Für das Grafik-Rendering sind G5g-Instanzen die kostengünstigste Option für AWS-Kunden.
Die Instanzen sind mit einer Reihe von Grafik- und Machine Learning-Bibliotheken unter Linux kompatibel, darunter NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS und TensorRT. Die G5g-Instanzen sind derzeit in den Regionen USA Ost (Nord-Virginia), USA West (Oregon) und Asien-Pazifik (Seoul, Singapur und Tokio) als On-Demand-, Spot-, Sparplan- und Reserved-Instanzen verfügbar.
AWS führt auch die EC2 M6a-Instanzen mit AMD Epyc-Prozessoren der 3. Generation ab sofort als allgemein verfügbar. Sie laufen mit Frequenzen von bis zu 3,6 GHz und bieten bis zu 35 Prozent mehr Leistung als die M5a-Instanzen der vorherigen Generation. Diese neuen Instanzen eignen sich gut für allgemeine Arbeitslasten wie Webserver, Anwendungsserver und kleine Datenspeicher.
Neueste Kommentare
Noch keine Kommentare zu AWS bietet Graviton2-basierte EC2-Instanzen für GPU-basierte Workloads
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.