ATOP丨CPO VS 可插拔光模块:AI 网络的共赢增长之道

发布者:华拓光通信
时间:2025-09-29
收藏
已收藏

ATOP丨CPO VS 可插拔光模块:AI 网络的共赢增长之道

图片

CPO 改变的是光学端的形态与位置,不是“端到端是否需要光学”的物理事实。随着 AI 集群带宽(端口数×速率)持续上行,总光学需求上升。在可预见阶段(800G → 1.6T),可插拔光模块继续放量;中长期 CPO/NPO/OBO+可插拔模块分工共存、共同增长ATOP 已实现1.6T可插拔量产交付,并布局 CPO 生态(光引擎、外置激光ELSFP、高密互连)。我们判断 3.2T 可插拔先进调制(如 TFLN)下以OSFP-XD和OSFP封装可实现。


ATOP观点

即使进入 CPO 时代,光学用量仍然“共增而非替代”


  • 端到端(End-to-End):CPO 只是把交换侧的光学从面板移到 ASIC 边上,一条链路两端都必须有光学终端这件事从未改变;随着集群规模与端口速率上行,端到端光通道数持续增加


  • 机柜到机柜(Rack-to-Rack):AI集群的 Scale-Up(超大 Pod)+Scale-Out(更多机柜/机架) 同步推进;OCS/CPO 减少了电脊层,但增加了跨机柜的光电路,机柜到机柜的光口总量与纤路密度一起增长


  • 形态共赢:可插拔(含 LPO)在可维护/快速迭代场景继续放量;CPO/近封装在高密/高能效场景扩张。模块 → 光引擎/外置激光/高密线束只是形态迁移,总光学价值链更长、容量更大。


  • ATOP 路线1.6T 可插拔批量+CPO 生态布局(光引擎、外置激光、扇出/高密互连)并行推进;同时验证 3.2T 可插拔(OSFP-XD+400G/lane,含 TFLN异质集成方案) 的可实现性,两条曲线共同抬升


1

为何两者都会增长(不是二选一)

  • 两端仍需光学:CPO 把光学贴近交换 ASIC;对端仍需光学终端(可插拔/LPO、CPO 或 NPO/OBO)。

  • 分工互补:可插拔强调可维护/互通速度;CPO 在高 lane 速率下打开能效/密度LPO 与 CPO 同属线性直驱,带来更低功耗/时延(主机需满足 CEI-112G/224G Linear 类要求)。

  • 带宽只增不减:端口×速率同步上行 → 端到端光通道增多,并形成光引擎RLS/ELS 外置激光、高密扇出等新增价值环节。


2

端到端落地模式(ATOP视角)

  • CPO ↔ CPO(短距/超高密度):BOM从“模块”转为光引擎+外置激光(RLS/ELS/ELSFP)+高密连接/线束。

  • CPO ↔ LPO/可插拔:交换侧由 CPO 解决密度/热;对端保留 FRU。两端线性直驱 → 功耗/时延更优,前提是主机均衡与面板一致性到位。

  • CPO ↔ NPO/OBO:把光学前移到 NIC/加速卡板上,规避超大可插拔的面板/纤数瓶颈,适配 >1.6T/端口场景。


面向 3.2T/6.4T/端口:可选CPO ↔ CPO/CPO ↔ NPO/OBO,或把“超端口”扇出为多×1.6T(带状 SMF + 高密线束)。并行 SMF 为主流,MCF 仍处于探索阶段。


3

速率与 PMD(清晰示例)

代际

典型电口

光学 PMD 示例(IM-DD)

800G

8×100G

DR8;

2 × FR4

2 × DR4

1.6T

8×200G

1.6T-DR8;

2 × 800G-FR4

(或按场景 4 × 400G-DR4)

3.2T

可插拔

OSFP-XD

16× 200G

8× 400G 并行

或2 × 1.6T-FR4

(依面板/布线方案)

注:

  • LPO 依赖主机线性 SerDes(CEI-112G/224G Linear);通道困难处可用 DSP 可插拔。

  • FEC/PCS 需对齐(如 RS(544,514) 或等效)。

  • Breakout(如 2×400G-DR4、2×800G-DR4)是落地常用手法。


4

3.2T 可插拔可行性(ATOP 立场)

  • 外形:OSFP-XD 提供 16 lane 与 >60 W 级功耗窗口(3.3 V,电流可达20 A),经正确散热可承载 3.2T。3.2T OSFP在OSFP-XD之后会逐步具备可行性。

  • 电口:200G/lane(IEEE 802.3dj, 224G PAM4),线性或重定时两种体系可选。PAM6或PAM8调制为电口速率提升到400G/lane带来了新的途径。

  • 光学:400G/λ IM-DD 可由 EML、SiPh MZM(异质集成)、或 TFLN(薄膜铌酸锂)实现;TFLN 已展示 >100 GHz 电光带宽,实验样机已实现3.2T级IM-DD传输。


5

ATOP 当前交付

图片
  • 1.6T 可插拔量产(800G 产品矩阵量产打磨完备)。

  • LPO 产品线

  • 互通“黄金配方”:对齐 PCS/FEC/PMD、支撑规模部署稳定性。


6

我们的 CPO 生态布局

  • 光引擎封装与测试(SiPh/PIC 对准、耦合、老化、可靠性)。

  • 外置激光(RLS/ELS/ELSFP):更低热、更集中、可冗余的光源方案。

  • 高密互连与扇出线束:提升 Tb/s per fiber,简化布线(并行 SMF 为主流,MCF 为储备)。


7

如何量化“共赢”(系统级 TCO)

  • 单位比特能耗 W/Tb/s:对比 CPO ↔ LPO 与 DSP 可插拔。

  • 端到端时延:对训练时长与收敛步数的影响。

  • 可用性/MTTR:FRU 更换速度(可插拔)vs 集中化维护(CPO)。

  • 每 Tb/s 纤数:带状 SMF+扇出设计带来的纤数收益。

  • FEC symbol errors & BER:规模化部署的稳定裕量。