Categories: InnovationKINetzwerke

Lichtgeschwindigkeit für generative KI

IBM-Forscher haben im Forschungszentrum in Rüschlikon bei Zürich bahnbrechende Forschungsergebnisse im Bereich der Optiktechnologie vorgestellt. Das neue Verfahren „Co-Packed Optics“ (CPO) verbessert erheblich die Art und Weise, wie Rechenzentren generative KI-Modelle trainieren und ausführen können. CPO ermöglicht die Konnektivität in Rechenzentren mit Lichtgeschwindigkeit und kann bestehende elektrischen Verbindungen mit kurzer Reichweite ergänzen. CPO könnte die Bandbreite in Rechenzentren erheblich erhöhen, die Stillstandzeiten von Grafikprozessoren minimieren und gleichzeitig die KI-Verarbeitung drastisch beschleunigen. Die Polymer-Lichtwellenleiter (PWG) zur Unterstützung dieser Technologie definieren neu, wie Daten mit hoher Bandbreite zwischen Chips, Leiterplatten und Servern übertragen werden.

Energieverbrauch für KI-Modell-Training sinkt deutlich

Heute werden Daten mit hoher Geschwindigkeit über große Entfernungen per Glasfasertechnologie übertragen. Obwohl Rechenzentren Glasfaser für ihre externen Kommunikationsnetze verwenden, werden die Racks in Rechenzentren immer noch überwiegend über kupferbasierte, elektrische Leitungen betrieben. Diese Leitungen verbinden GPU-Beschleuniger, die mehr als die Hälfte ihrer Zeit im Leerlauf verbringen und auf Daten in einem großen, verteilten Trainingsprozess warten, was erhebliche Kosten und Energie verursachen kann.

Die CPO-Innovation verringert im Vergleich zu elektrischen Verbindungen den Energieverbrauch für die Skalierung generativer KI um das Fünffache. Gleichzeitig verlängert CPO die Länge der Verbindungskabel von Rechenzentren von einem auf Hunderte von Metern. Pro trainiertem KI-Modell lässt sich so viel Energie einsparen, wie 5.000 US-Haushalte pro Jahr verbrauchen. Weiterhin lassen sich Large Language Model (LLM) mit CPO bis zu fünfmal schneller trainieren als mit herkömmlicher elektrischer Verkabelung. CPO könnte die Zeit für das Training eines Standard-LLM von drei Monaten auf drei Wochen verkürzen, wobei die Leistung durch den Einsatz größerer Modelle und mehr GPUs zunehmen.

„Da generative KI mehr Energie und Rechenleistung benötigt, muss sich das Rechenzentrum weiterentwickeln“, sagt Dario Gil, Director of Research bei IBM. “Mit diesem Durchbruch werden die Chips von morgen ähnlich kommunizieren, wie Glasfaserkabel Daten in und aus Rechenzentren transportieren, und eine neue Ära schnellerer, nachhaltigerer Kommunikation einläuten, die die KI-Arbeitslasten der Zukunft bewältigen kann.“

80-mal schnellere Bandbreite für Chip-zu-Chip-Kommunikation

In den letzten Jahren haben Fortschritte in der Chiptechnologie dazu geführt, dass Transistoren auf einem Chip dicht gepackt werden können. Die 2-Nanometer-Knoten-Chiptechnologie von IBM kann mehr als 50 Milliarden Transistoren enthalten. Die CPO-Technologie zielt darauf ab, die Verbindungsdichte zwischen Beschleunigern zu erhöhen, indem sie es Chipherstellern ermöglicht, optische Pfade hinzuzufügen, die Chips auf einem elektronischen Modul über die Grenzen der heutigen elektrischen Pfade hinaus verbinden. Diese neuen optischen Strukturen haben das Potenzial, die Bandbreite zwischen Chips im Vergleich zu elektrischen Verbindungen um das 80-fache zu erhöhen.

Die Innovation würde es Chipherstellern ermöglichen, am Rand eines Silizium-Photonik-Chips sechsmal so viele optische Fasern hinzuzufügen, was als „Strandpromenaden-Dichte“ bezeichnet wird, im Vergleich zur aktuellen CPO-Technologie auf dem neuesten Stand der Technik. Jede Faser, die etwa dreimal so breit ist wie ein menschliches Haar, könnte bis zu Hunderten von Metern lang sein und Terabit an Daten pro Sekunde übertragen.

Roger Homrich

Recent Posts

Open-Source-Malware auf Rekordniveau

Alarmierender Anstieg von Open-Source-Malware / Seit 2019 haben Sonatype-Analysen mehr als 778.500 bösartige Pakete aufgedeckt

5 Stunden ago

Bayerische KI-Agentur bietet KI-KOMPASS

Das KI-Werkzeug "BAIOSPHERE KI-KOMPASS" soll Unternehmen den Einstieg in KI erleichtern.

5 Stunden ago

Cloudflare: Weltweiter Internettraffic wächst 2024 um 17,2 Prozent

Das Wachstum konzentriert sich wie im Vorjahr auf das zweite Halbjahr. Google dominiert bei den…

7 Stunden ago

Adobe stopft kritische Löcher in Reader und Acrobat

Sie ermöglichen eine Remotecodeausführung. Angreifbar sind Acrobat DC, 2024 und 2020 sowie Reader DC und…

7 Stunden ago

Dezember-Patchday: Microsoft schließt Zero-Day-Lücke

Die öffentlich bekannte und bereits ausgenutzte Schwachstelle erlaubt eine Rechteausweitung. Betroffen sind alle unterstützten Versionen…

13 Stunden ago

Quantencomputer: Google meldet Durchbruch bei Fehlerkorrektur

Der neue Quantenchip Willow löst eine Herausforderung, an der seit 30 Jahren gearbeitet wird. Google…

1 Tag ago