Categories: KI

Big Blue kündigt Zusammenarbeit mit AMD an

Das Angebot soll in der ersten Jahreshälfte 2025 verfügbar sein. Es zielt darauf ab, die Leistung und Energieeffizienz von Gen-AI-Modellen wie etwa im High Performance Computing (HPC) für Unternehmenskunden zu verbessern. Die Zusammenarbeit werde auch die Unterstützung von AMD Instinct MI300X Accelerators innerhalb der IBM watsonx AI- und Datenplattform sowie die Unterstützung von Red Hat Enterprise Linux AI-Inferenz ermöglichen, so IBM weiter.

„Da Unternehmen immer größere KI-Modelle und Datensätze implementieren, ist es von entscheidender Bedeutung, dass die Beschleuniger innerhalb des Systems rechenintensive Workloads mit hoher Leistung und Flexibilität zur Skalierung verarbeiten können“, so Philip Guido, Executive Vice President und Chief Commercial Officer von AMD. „Unsere Zusammenarbeit mit IBM Cloud wird darauf abzielen, Kunden die Ausführung und Skalierung von Gen AI Inferencing zu ermöglichen, ohne dass dies zu Lasten von Kosten, Leistung oder Effizienz geht.“

Large Model Inferencing

Ausgestattet mit 192 GB High Bandwidth Memory (HBM3) bieten AMD Instinct MI300X Accelerators- Unterstützung für Large Model Inferencing und Fine Tuning. Die große Speicherkapazität soll Kunden auch dabei helfen, größere Modelle mit weniger GPUs auszuführen, wodurch die Kosten für die Inferecing möglicherweise gesenkt werden, so IBM weiter. Zudem soll die Bereitstellung von AMD Instinct MI300X Accelerators als Service auf IBM Cloud Virtual Servers for VPC sowie die Unterstützung von Containern mit IBM Cloud Kubernetes Service und IBM Red Hat OpenShift on IBM Cloud können dazu beitragen, die Leistung unternehmensinterner KI-Anwendungen zu optimieren.

Für generative AI Inferencing Workloads plant IBM, die Unterstützung für AMD Instinct MI300X Accelerators in der watsonx AI und Datenplattform von IBM zu ermöglichen und watsonx Kunden zusätzliche KI-Infrastrukturressourcen für die Skalierung ihrer KI-Workloads in Hybrid-Cloud-Umgebungen bereitzustellen. Darüber hinaus können laut IBM auf den Red Hat Enterprise Linux AI und Red Hat OpenShift AI Plattformen Large Language Models (LLMs) der Granite-Familie mit Alignment-Tools unter Verwendung von InstructLab auf MI300X Accelerators ausgeführt werden.

Manuel

NextDer Griff zum Smartphone kann kurzzeitig die Stimmung heben »

Previous « Jeder zweite vereinbart Arzttermine online

Published by

Manuel

Tags: AMDIBMKI

3 Monaten ago

CYBERsicher Notfallhilfe für mittelständische Unternehmen

Transferstelle Cybersicherheit im Mittelstand hat Tool entwickelt, das Unternehmen hilft, einen Vorfall einzuschätzen und in…

7 Stunden ago

135 Millionen kompromittierte Konten in Deutschland

Im Jahr 2024 wurden in Deutschland durchschnittlich vier Nutzerkonten von Onlinediensten pro Sekunde kompromittiert.

7 Stunden ago

Microsoft entfernt Standortverlauf aus Windows

Die Änderung betrifft Windows 10 und Windows 11. Künftig verzichtet Windows somit auf die lokale…

10 Stunden ago

Halbleiter

Big Blue kündigt Zusammenarbeit mit AMD an

Large Model Inferencing

Recent Posts

CYBERsicher Notfallhilfe für mittelständische Unternehmen

135 Millionen kompromittierte Konten in Deutschland

Microsoft entfernt Standortverlauf aus Windows

Bericht: TSMC verhandelt Übernahme von Intels Chip-Fabriken

Passwort-Cracking: Die drei gefährlichsten Angriffsmethoden und wie man sich davor schützt

Schwachstellen bei Wearables mit medizinischen Teilfunktionalitäten

Big Blue kündigt Zusammenarbeit mit AMD an

Large Model Inferencing

Related Post

Recent Posts

CYBERsicher Notfallhilfe für mittelständische Unternehmen

135 Millionen kompromittierte Konten in Deutschland

Microsoft entfernt Standortverlauf aus Windows

Bericht: TSMC verhandelt Übernahme von Intels Chip-Fabriken

Passwort-Cracking: Die drei gefährlichsten Angriffsmethoden und wie man sich davor schützt

Schwachstellen bei Wearables mit medizinischen Teilfunktionalitäten