IBM hat ein Co-Packaged Optics (CPO)-Modul vorgestellt, das verspricht, die Ineffizienzen der KI-Rechenzentrumskommunikation zu beseitigen.
Durch die Integration von Polymer-Lichtwellenleiter (PWG) direkt in Computersysteme integriert, zielt die Technologie darauf ab, eine schnellere und energieeffizientere Datenübertragung für anspruchsvolle Arbeitslasten zu ermöglichen.
Kupferkabel als Engpass
Seit Jahrzehnten sind Glasfaserkabel das Rückgrat der externen Datenkommunikation in Rechenzentren und bewältigen große Mengen an Internetverkehr. Interne Systeme innerhalb dieser Einrichtungen – in denen GPUs, Prozessoren und andere Komponenten interagieren – sind jedoch weiterhin auf kupferbasierte elektrische Verkabelung angewiesen.
Diese veraltete Infrastruktur führt zu Engpässen, die die für erweiterte KI-Workloads erforderliche Hochgeschwindigkeitsverarbeitung behindern und zu Verschwendung führen Energie und erhöhte Kosten.
IBMs neue optische Technologie zielt darauf ab, diese Herausforderungen zu bewältigen, indem sie Geschwindigkeiten auf Glasfaserniveau in die interne Architektur von Rechenzentren einführt.
Verwandt: xAI wird erweitert Colossus Supercomputer verzehnfacht bis zu 1 Million GPUs
Optische Konnektivität für Halbleiter
Das neue CPO-Modul integriert optische Konnektivität direkt in Halbleitersysteme und bietet Bandbreitenverbesserungen von bis zu 80-mal im Vergleich zu herkömmlichen elektrischen Verbindungen.
Dieser Fortschritt könnte GPU-Ausfallzeiten reduzieren, KI-Trainingsprozesse beschleunigen und den Energieverbrauch deutlich senken und IBM damit als Vorreiter im Streben nach nachhaltigerem Computing positionieren.
Das mitverpackte Optikmodul von IBM basiert auf der Polymer Optical Waveguide (PWG)-Technologie, wie in erläutert Detail in a IBM-Forschungspapier. Ein Wellenleiter ist eine Struktur, die Licht lenkt und so eine optische Hochgeschwindigkeitskommunikation zwischen Geräten ermöglicht.
Die PWG-Innovation ermöglicht das, was IBM-Forscher als „Beachfront Density“ bezeichnen, ein Design, das sechsmal mehr optische Fasern gleichzeitig aufnimmt Obwohl jede Faser nur geringfügig breiter als ein menschliches Haar ist, kann sie Terabit an Daten pro Sekunde über Entfernungen von wenigen Zentimetern bis zu Hunderten von Metern übertragen.
Verwandt: Amazon Stellt Nvidias KI-Dominanz mit dem Ultracluster-Supercomputer in Frage
Wie es funktioniert: Technische Details
Das Modul verwendet optische Kanäle mit einem Abstand von 50 Mikrometern Die adiabatische Kopplung mit Silizium-Photonik-Wellenleitern sorgt für eine effiziente und zuverlässige Datenübertragung. IBM hat auch Konfigurationen mit einem 18-Mikrometer-Abstand untersucht und durch Stapelung mehrerer Kanäle den Weg für bis zu 128 Konnektivitätskanäle geebnet Wellenleiter.
Mukesh Khare, General Manager der Semiconductors-Abteilung von IBM, erläuterte die Bedeutung dieses Durchbruchs: „Co-packaged Optics ermöglicht schnelle optische Konnektivität durch Fasern, die in unmittelbarer Nähe zu Beschleunigern montiert werden, wodurch die Kommunikationslücke verringert wird.“ zwischen KI-Modellen.“
Über seine technischen Spezifikationen hinaus zeichnet sich das optische Modul durch seine Energieeffizienz aus. IBM berichtet, dass die neue Technologie den Energieverbrauch im Vergleich zu herkömmlichen elektrischen Verbindungen der Mittelklasse um den Faktor fünf senken könnte.
In der Praxis bedeutet dies die Möglichkeit, ein großes Sprachmodell (LLM) in drei Wochen statt in drei Monaten zu trainieren und dabei nur einen Bruchteil der Energie zu verbrauchen. IBM schätzt, dass die Energieeinsparungen durch eine einzige KI-Schulungssitzung bis zu 5.000 US-Haushalte ein ganzes Jahr lang mit Strom versorgen könnten.
Diese Einsparungen betreffen nicht nur die Betriebskosten von Rechenzentren, sondern auch die Umweltauswirkungen von Energie-intensive Rechenleistung.
Stresstests zeigen Haltbarkeit
IBM hat das Modul umfangreichen Stresstests unterzogen, um seine Zuverlässigkeit in realen Anwendungen sicherzustellen. Die Komponenten wurden extremen Temperaturen von-40 °C bis 125 °C, hoher Luftfeuchtigkeit und strengen mechanischen Haltbarkeitstests ausgesetzt.
Die Ergebnisse bestätigten, dass die optischen Verbindungen Biegungen und anderen Belastungen ohne Verschlechterung standhalten konnten in der Leistung. Dieses Maß an Haltbarkeit stellt sicher, dass das Modul für den groß angelegten Einsatz in kommerziellen Rechenzentren geeignet ist.
Die Entwicklung des gemeinsam verpackten Optikmoduls von IBM spiegelt eine gemeinsame Anstrengung internationaler Einrichtungen wider. Forschung und Design wurden im National Semiconductor Technology Center (NSTC) in Albany, NY durchgeführt, während die Montage und Prüfung des Prototyps dauerte findet im IBM-Werk Bromont in Quebec statt.
Diese Bemühungen bauen auf IBMs Erbe der Halbleiterinnovation auf, zu dem Meilensteine wie IBMs 2021 vorgestellter 2-Nanometer-Chip und Fortschritte bei Nanoblatt-und vertikalen Transistoren.
Nachfrage im Rechenzentrum nach Höhere Geschwindigkeit
Die Auswirkungen dieser Innovation gehen über die KI hinaus. Da Rechenzentren mit wachsenden Anforderungen an Geschwindigkeit, Effizienz und Nachhaltigkeit konfrontiert sind, könnten Technologien wie das CPO-Modul von IBM neue Maßstäbe für die Computerinfrastruktur setzen.
Durch die Behebung von Engpässen in der internen Kommunikation verbessert das optische Modul nicht nur die Leistung von KI-Workloads, sondern trägt auch zum breiteren Vorstoß für umweltfreundlichere und effizientere Technologiesysteme bei.
Dario Gil unterstrich die potenziellen Auswirkungen der Technologie: „Mit diesem Durchbruch werden die Chips von morgen ähnlich wie Glasfaser kommunizieren.“ Kabel Übertragen Sie Daten in und aus Rechenzentren und läuten Sie eine neue Ära schnellerer und nachhaltigerer Kommunikation ein, die die KI-Arbeitslasten der Zukunft bewältigen kann.“