Lichtgeschwindigkeit für generative KI 

Optiktechnologie könnte elektrische Verbindungen in Rechenzentren ersetzen und so Geschwindigkeit und Energieeffizienz für KI erheblich verbessern.

IBM-Forscher haben im Forschungszentrum in Rüschlikon bei Zürich bahnbrechende Forschungsergebnisse im Bereich der Optiktechnologie vorgestellt. Das neue Verfahren „Co-Packed Optics“ (CPO) verbessert erheblich die Art und Weise, wie Rechenzentren generative KI-Modelle trainieren und ausführen können. CPO ermöglicht die Konnektivität in Rechenzentren mit Lichtgeschwindigkeit und kann bestehende elektrischen Verbindungen mit kurzer Reichweite ergänzen. CPO könnte die Bandbreite in Rechenzentren erheblich erhöhen, die Stillstandzeiten von Grafikprozessoren minimieren und gleichzeitig die KI-Verarbeitung drastisch beschleunigen. Die Polymer-Lichtwellenleiter (PWG) zur Unterstützung dieser Technologie definieren neu, wie Daten mit hoher Bandbreite zwischen Chips, Leiterplatten und Servern übertragen werden.

Energieverbrauch für KI-Modell-Training sinkt deutlich

Heute werden Daten mit hoher Geschwindigkeit über große Entfernungen per Glasfasertechnologie übertragen. Obwohl Rechenzentren Glasfaser für ihre externen Kommunikationsnetze verwenden, werden die Racks in Rechenzentren immer noch überwiegend über kupferbasierte, elektrische Leitungen betrieben. Diese Leitungen verbinden GPU-Beschleuniger, die mehr als die Hälfte ihrer Zeit im Leerlauf verbringen und auf Daten in einem großen, verteilten Trainingsprozess warten, was erhebliche Kosten und Energie verursachen kann.

Die CPO-Innovation verringert im Vergleich zu elektrischen Verbindungen den Energieverbrauch für die Skalierung generativer KI um das Fünffache. Gleichzeitig verlängert CPO die Länge der Verbindungskabel von Rechenzentren von einem auf Hunderte von Metern. Pro trainiertem KI-Modell lässt sich so viel Energie einsparen, wie 5.000 US-Haushalte pro Jahr verbrauchen. Weiterhin lassen sich Large Language Model (LLM) mit CPO bis zu fünfmal schneller trainieren als mit herkömmlicher elektrischer Verkabelung. CPO könnte die Zeit für das Training eines Standard-LLM von drei Monaten auf drei Wochen verkürzen, wobei die Leistung durch den Einsatz größerer Modelle und mehr GPUs zunehmen.

„Da generative KI mehr Energie und Rechenleistung benötigt, muss sich das Rechenzentrum weiterentwickeln“, sagt Dario Gil, Director of Research bei IBM. “Mit diesem Durchbruch werden die Chips von morgen ähnlich kommunizieren, wie Glasfaserkabel Daten in und aus Rechenzentren transportieren, und eine neue Ära schnellerer, nachhaltigerer Kommunikation einläuten, die die KI-Arbeitslasten der Zukunft bewältigen kann.“

80-mal schnellere Bandbreite für Chip-zu-Chip-Kommunikation

In den letzten Jahren haben Fortschritte in der Chiptechnologie dazu geführt, dass Transistoren auf einem Chip dicht gepackt werden können. Die 2-Nanometer-Knoten-Chiptechnologie von IBM kann mehr als 50 Milliarden Transistoren enthalten. Die CPO-Technologie zielt darauf ab, die Verbindungsdichte zwischen Beschleunigern zu erhöhen, indem sie es Chipherstellern ermöglicht, optische Pfade hinzuzufügen, die Chips auf einem elektronischen Modul über die Grenzen der heutigen elektrischen Pfade hinaus verbinden. Diese neuen optischen Strukturen haben das Potenzial, die Bandbreite zwischen Chips im Vergleich zu elektrischen Verbindungen um das 80-fache zu erhöhen.

Die Innovation würde es Chipherstellern ermöglichen, am Rand eines Silizium-Photonik-Chips sechsmal so viele optische Fasern hinzuzufügen, was als „Strandpromenaden-Dichte“ bezeichnet wird, im Vergleich zur aktuellen CPO-Technologie auf dem neuesten Stand der Technik. Jede Faser, die etwa dreimal so breit ist wie ein menschliches Haar, könnte bis zu Hunderten von Metern lang sein und Terabit an Daten pro Sekunde übertragen.

 

Themenseiten: Glasfaser, KI, Rechenzentrum

Fanden Sie diesen Artikel nützlich?
Artikel finde ich nützlichArtikel finde ich nicht nützlich +2 von 2 Lesern fanden diesen Artikel nützlich.
Loading...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu Lichtgeschwindigkeit für generative KI 

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *