光互联的需求、现状和展望

发布者:图灵新智算
时间:2025-11-11
收藏
已收藏

一、提带宽,降功耗的需求催生了光互联


随着人工智能大模型参数规模以每两年约400倍的速度膨胀,智算集群正从“万卡级”向“十万卡级”迈进。在这一过程中,“超节点”架构成为关键——它通过高速互连技术将数十至上千张GPU集成于单个或多个机柜,以实现接近单机级的通信效率。


然而,当前主流的铜缆互连(如无源DAC)在高速、高密场景下暴露出四大瓶颈:

1. 距离极短:信号在10厘米的PCB走线中损耗即可超过15dB,难以支持跨机柜通信;

2. 功耗激增:速率提升至800Gb/s以上时,铜缆发热严重,散热成本急剧上升;

3. 速率天花板:受趋肤效应与寄生参数限制,单通道速率难以突破200Gb/s,多通道并行时串扰严重;

4. 布线困难:线缆数量随规模指数增长,机柜内空间与可维护性面临挑战。


这些限制使得铜缆无法支撑下一代智算集群的带宽、延迟与能效要求。光互联技术应运而生,其优势显著:

1. 高带宽密度:单纤可承载Tbps级带宽,远超铜缆;

2. 低信号损耗:光信号几乎不受电磁干扰,传输损耗比电信号低4~5个数量级;

3. 低功耗:通过缩短电信号路径,系统功耗可降低30%~50%;

4. 远距离覆盖:轻松支持从机柜内到数据中心间的百米至公里级传输。



二、光互联的技术方向和演进路线


目前,光互联技术正沿着“设备级→近封装→芯片级”的路径快速演进,形成多层次技术体系:


1. LPO:低功耗可插拔光模块

LPO(Linear Pluggable Optics)去除了传统光模块中的DSP芯片,将补偿功能移至GPU或交换芯片的SerDes中,显著降低功耗与延迟。2022年由Macom与NVIDIA联合推出,已成为800G数据中心的热门方案。

图片


2. NPO:近封装光学

NPO将光引擎贴装在GPU封装旁,通过数厘米内短距电链路相连,互连密度比可插拔模块提升2~3倍。其光引擎与GPU分离,散热与维护更为简便,成为国内GPU厂商的首选过渡方案。

图片


3. CPO:共封装光学

CPO将光引擎与交换芯片或GPU共同封装在同一基板上,电信号路径缩至毫米级,可实现整机功耗降低约50%,并突破前面板I/O密度限制。目前已在博通、英伟达等企业的交换机中实现初步商用。

图片


4. OIO:光学I/O

OIO以芯粒形式直接替换芯片的电I/O,实现纳秒级延迟与Tbps/mm²级带宽密度,能效比CPO再提升一个量级。它支持多节点显存光互联成统一池,是未来“存算一体”架构的核心。

图片


可插拔光模块(含LPO)、NPO、CPO和OIO四大技术在带宽密度、时延、能耗、兼容性等方面表现各异,共同构成了覆盖数据中心内不同需求场景的光互连技术体系(见下表)。

图片
图片



三、国内外相关产品和技术研究


1. 博通产品及技术方案

博通从2021年开始布局CPO,技术积累深厚。2024年实现了第二代51.2T CPO交换机的技术展示。其系统中含有8个光引擎,分布在交换机芯片的四个方向。每个光引擎内置64路收发器,每路收发器通道的带宽为100Gbps, 边缘带宽密度为500Gbps/mm2。

图片



2. 英伟达产品及技术方案

英伟达在GTC2025大会首次展示了CPO交换机产品,英伟达的硅光芯片采用了单波长的微环调制器(microring modulator, MRM),单通道信号速率为200Gbps。每个光引擎含8个通道,总速率为1.6Tbps。单颗交换芯片配置6个模组,每三个光引擎组合成一个模组,交换芯片总带宽为28.8Tbps。交换机中含有四颗交换芯片,交换设备总带宽为115.2Tbps。

图片


3. 新华三公司解决方案

新华三聚焦于CPO外置光源的研发,基于IPEC组织的PELS定义,依托其在交换机和光模块领域的深耕经验,投入核心研发力量开发了全新PELS直通型外置光源。

图片


4. 清华大学集成光电子实验室解决方案

清华大学集成光电子实验室开发基于Micro-LED阵列的光互连技术,依托其在高速Micro-LED材料外延和芯片工艺领域的深耕经验,演示了多通道并行传输原理样机。

图片


5. 曦智科技公司解决方案

曦智科技作为国内进入CPO技术领域较早的企业,同国内GPU厂商合作研发了国内首个xPU-CPO光电共封装原型系统,采用超短距接口进行数据传输,产品旨在打破国产工艺中因制程限制导致的带宽瓶颈、充分利用光互连的高密度、低延迟和长距离特性,构建新一代数据中心通信架构。目前进行交换芯片CPO的开发,预计原型机2026年问世。

图片



四、总结和展望


我国芯片级光互连刚起步,但后劲十足,硅光芯片、高密度封装等关键环节正突破,模块厂和光引擎初创公司陆续推出原型产品,形成“标准-芯片-设备”闭环。在智算集群需求拉动下,正从技术研究迈向试点商用,自主可控与规模应用潜力大。


芯片级光互连通过“芯片-设备-集群”全光架构,从“可插拔”走向“芯片级”,把光引擎与电芯片合封,传输距离缩至毫米级,系统能效提升50%以上,成为突破万卡向十万卡智算集群“带宽、延迟、功耗”三重瓶颈的下一代关键技术。