跳转至

2025-11-10 · Google TPU v7 Ironwood + Apollo OCS 大规模部署

摘要(Takeaway)

  • Google TPU v7 Ironwood + Apollo OCS 完成 9216 chip SuperPod + 48 OCS 大规模落地,是 OCS 从 Spine 层进一步推进至 Scale-up 层(Pod 内立方体互联)的代际转折,标志着光路交换在 AI 算力集群骨干的地位被永久确立。
  • MEMS 微镜阵列 OCS(Palomar)整机 ~108W vs 同等端口 EPS ~3000W,节电 ~95%;对速率/调制透明意味着 800G→1.6T→3.2T 演进时"换模块不换骨干",骨干代际折旧周期被拉长,光模块/光芯片成为代际升级的真正承担者
  • 2026 年 Google TPU 出货近 400 万颗 → 800G+ 光模块需求 >600 万只(TrendForce),叠加 800G+ 出货占比破 60%、1.6T 起量;A 股核心受益链条:中际旭创/新易盛(光模块)+ 凌云光/赛微电子(OCS 国产替代)+ 上游光芯片。

一、事件背景(Google OCS 历史与 Apollo 投入口径)

Apollo 是全球首个在数据中心规模量产部署的光路交换(OCS)系统,已经服役近十年,构成了 Google 数据中心的网络骨干。[Google 官方] [SemiAnalysis]

  • 2025-11-06 至 11-10:Google 正式发布第七代 TPU "Ironwood",宣布于 2025 年 11 月底全面可用,并首次完整披露与 Apollo OCS 深度协同的 9216-chip SuperPod 架构。[Google 官方] [HPCwire]
  • 资本投入口径:市场流传"Apollo $3B 投入"说法,但权威渠道并未披露该确定数字;产业侧更一致的判断为 2026 年 Google OCS 网络侧支出约 $1.5–2.0B(与 BofA 预测的 \(1.74B 接近),\)3B 说法证据不足,建议采用区间情景。[内资研报] [外资研报]
  • 历史代际:过去 5 年 Google 已"累计部署数万台 136×144 端口 OCS",验证了 OCS 在生产环境的可靠性,2025 年的 TPU v7 是首次将 OCS 从 Spine 层进一步推到 Scale-up 层(Pod 内立方体互联)。[SemiAnalysis]

二、TPU v7 Ironwood 关键参数

  • 单片规格:FP8 稠密算力 4.6 PFLOPS,BF16 2.307 PFLOPS;HBM3e 192 GB;带宽 7.2–7.4 TB/s;ICI 双向带宽 1.2 Tb/s;3nm(N3P/N3E)。[Google 官方] [内资研报]
  • SuperPod 规模9216 片(144 个 4×4×4 立方体),共享 HBM 1.77 PB;FP8 峰值 >42.5 EFLOPS;可在 DCNI 层经 300×300 大端口 OCS×256 台扩展至 147,456 片单逻辑域。[The Register] [内资研报]
  • TCO 优势:内部测算 TPU v7 相对 GB200/GB300 的单位有效算力成本低 30–44%;MFU≈15% 即可盈亏平衡,而 GB300 需要约 30%。[内资研报] [第三方报告]
  • 关于"v7 FP4 3.6 EF"的辨析:现有权威资料未给出 v7 的 FP4 口径;FP4 首次明确由 v8t/v8i 引入,应以 FP8 / SuperPod 42.5 EF 为准,避免代际配置混用。[内资研报]

三、Apollo OCS 技术深度

3.1 MEMS 微镜阵列工作原理

  • Apollo 内部代号 Palomar,核心是 MEMS 微镜封装:176 个独立可控 3D 微镜,因良率原因实际启用 136 个。[SemiAnalysis] [arXiv 2208.10041]
  • 每面微镜可被独立电控偏转,将入射光束精确映射至输出光纤束的目标端口;对速率/调制格式完全透明,意味着 800G→1.6T→3.2T 演进时"换模块不换骨干"。[Google 官方]
  • 单台 OCS 实现非阻塞 136×136(早期)/ 300×300(DCNI 层新代)/ 600 端口(TPU v7 SuperPod 假设代际)的全光交换。[内资研报] [SemiAnalysis]

3.2 单 OCS ~100W vs 传统电交换 ~3000W(功耗 -95%)

  • Palomar OCS 整机功耗约 108W,主要消耗在维持微镜位置;同等端口规模的 EPS(电交换)约 3000W节电 ~95%[SemiAnalysis] [DCD]
  • 物理意义不止节能:省去 O/E/O 多次转换与多级包转发缓存,链路时延趋近 0;硬件代际寿命显著长于电交换芯片(不绑定 SerDes 速率),折旧友好。[内资研报]
  • Google 内部验证:脊层置换/直连架构下,吞吐 +30%、功耗 -40%、数据流完成时间 -10%、宕机时长 -50×、CapEx -30%。[arXiv 2208.10041]

3.3 Palomar(当前代)已"广泛部署"

  • 累计部署 OCS 数量已达"数万台"量级;TPU v4/v5/v6 已使用 OCS 做 Spine 替换,TPU v7 是首次将 OCS 推进到 Scale-up 内立方体互联的代际。[SemiAnalysis] [内资研报]
  • Palomar 系统采用前后向兼容设计:与 Google 数据中心当前及未来使用的任意波长/带宽兼容,意味着同一台 OCS 可服务从 800G 到 1.6T、3.2T 多代光模块的接入,资本开支边际效率显著[Google 官方]

3.4 OCS 路线图与技术路线分化

  • MEMS 路线(Google/Lumentum):当前主流,端口密度高、插损可控、可靠性经过 10 年量产验证;瓶颈在 MEMS 微镜良率(Palomar 176 启用 136 即体现)。
  • 液晶路线(Coherent):插损更低、切换速度更快,但端口扩展性弱于 MEMS;NVIDIA 投资 Lumentum 与 Coherent,意味着 OCS 双路线并存格局延续。[内资研报]
  • 压电陶瓷 DLBS(Polatis/凌云光):低插损/低回波损耗优势明显,但端口扩展与装调复杂度限制大端口推广,适配差异化场景或冗余层应用。[内资研报]
  • 硅光波导(iPronics 等):集成度高、潜力可观,但插损/串扰仍需演进,短期内难成主流。[内资研报]

四、产业级影响

4.1 OCS 取代电交换(数据中心架构革命)

  • 传统 Clos 架构以 EPS 为骨干,OCS 直接替换 Spine 层;TPU v7 进一步将 OCS 嵌入 Pod 内立方体互联,Scale-up 网络从铜缆+电交换走向"短铜+长光+全光交换"混合[内资研报]
  • 端口密度的两种版本并存(总端口共指向 ≈13,824):
  • 版本 A:48 台 144×144 OCS(早期稳定口径)。
  • 版本 B:48 台 600 端口 OCS(由 144 立方体×96 光口/立方体均摊推导)。
  • 差异反映工程实现与代际产品并行演进,单机 BOM 与供应商组合存在分化。[内资研报]

4.2 光路交换替代分组交换的趋势

  • OCS 对速率/调制透明意味着网络骨干代际折旧周期被显著拉长,而光模块/光芯片层成为代际升级的真正承担者。
  • 跨 Pod 扩展使用 300×300 大端口 OCS×256 台聚合,构成上层"光路直连"骨干,分组交换被压缩到末端。[内资研报]

4.3 拉动 800G+ 光模块需求(近 4M TPU → 6M+ 模块)

  • TrendForce 等多家机构测算:2026 年 Google TPU 出货 近 400 万颗,对应 800G+ 光模块需求超 600 万只[TrendForce] [内资研报]
  • 全球 800G+ 光模块出货占比由 2024 年 19.5% → 2026 年 >60%;2025 年全球出货 2400 万只 → 2026 年跃升至接近 6300 万只(×2.6)[TrendForce]
  • 供给端:Innolight + Eoptolink 合计拿下 Google 80% 800G+ 订单;Lumentum 产能已排至 2028 年底,OCS 积压订单 >\(400M**,2026Q4 收入预计 **>\)100M[TrendForce] [内资研报]

4.3.1 TPU v7 光模块需求分级配比(机架 → Pod → 集群)

网络层级 规模 光模块需求 配比
单机架 TPU v7 单机架 96 个光模块 1:1.5(单 chip 配 1.5 个)
单 Pod(SuperPod) 9,216 chip 13,824 个光模块 1:1.5(与机架保持一致)
跨 Pod 扩展(DCN) 147,456 TPU(147k 集群) 约 29.5 万个光模块 1:2(跨 Pod DCN 链路引入额外光化层)

关键解读:147k 集群相比单 Pod 配比从 1:1.5 升至 1:2(+33%),反映了 DCN 扩展层(跨 Pod)的光模块密度高于 Pod 内 OCS 互联——这是 Scale-up 全光化之外,Scale-across 跨集群互连的光模块拉动叠加层。[内资研报]

4.4 Scale-up 网络的全光化

  • TPU v7 在单 Pod 内通过 OCS 重构 X/Y/Z 三轴 3D Torus,是 Scale-up(节点内/Pod 内)走向全光化的标志性事件;NVIDIA NVLink 域当前仍以铜缆+电交换为主,分歧路径已经形成。
  • Anthropic 已签约最高 100 万颗 TPU v7(2026 年起),与 Google 的 Apollo OCS 架构深度绑定。[内资研报]
  • 工程意义:单 Pod 内 OCS 切片可动态重构(数十毫秒级完成),实现热点流量跨立方体回避故障域 Pod 内自愈;这是传统铜缆+电交换无法实现的"软光网络"能力。[arXiv 2208.10041]

4.5 上游光芯片/激光器的连锁拉动

  • TrendForce:AI 数据中心激光器短缺已经形成,NVIDIA 战略锁定全球激光器供应链;Google 近 4M TPU 落地将进一步加剧上游 EML/VCSEL 紧张。[TrendForce]
  • 上游光芯片国产化路径打开:源杰科技、长光华芯、武汉敏芯等 EML/VCSEL 供应商在 800G/1.6T 浪潮中受益,但Google 链条对可靠性要求极高,国产化突破节奏需谨慎跟踪

五、对 A 股的传导

公司 影响方向 关键观察点
凌云光 (688400) 压电 DLBS OCS / Polatis 代理(A 股 OCS 标杆之一) 国内交付落地节奏;端口扩展能力突破;非 Google 客户拓展(国内云厂商)
赛微电子 (300456) MEMS 代工(瑞典 Silex),切入 MEMS-OCS 微镜阵列 北京亦庄产线 MEMS-OCS 量产验证;非 Google 客户首单兑现时间
中际旭创 (300308) Google 800G/1.6T 光模块核心供应商(与 Innolight 协同) TPU 配套份额;1.6T 放量节奏;硅光自给率
新易盛 (300502) 800G+ 光模块二供(Eoptolink) Google 订单兑现;产能爬坡
光迅科技 (002281) OCS 模块/光器件跟进 国产 OCS 整机突破;上游器件供给
华工科技 (000988) MEMS 工艺布局 跟进微镜阵列工艺路线
英唐智控 (300131) 拟收购光隆集成切入 OCS 领域 收购落地与产品验证

现实约束:Google OCS 主供短期集中于 Lumentum(MEMS)+ Coherent(液晶),且客户对可靠性与算法控制栈耦合要求极高,新增主供短期难度大。本土厂商更现实的路径是上游关键器件、整机代工、非 Google 客户切入,逐步验证端口密度、插损、切换时间。[内资研报]

五点五、风险与不确定性

  1. OCS 主供格局的"护城河":Lumentum/Coherent 与 Google 的算法控制栈深度耦合(OCS 调度依赖 SDN 与 TPU 编排算法),新进入者短期内难以撼动主供地位;A 股标的更现实的路径是"非 Google 客户"+"上游器件"。
  2. "$3B Apollo 投入"口径需谨慎:权威信源未确认;产业侧更可信的判断是 2026 年 OCS 网络侧支出 $1.5–2.0B,模型测算应采用区间情景而非单点假设。[内资研报]
  3. OCS 端口密度并行版本:48×144 vs 48×600 工程实现差异影响单机 BOM 与厂商组合,需持续跟踪 Google 下一轮技术发布或实物图核实。[内资研报]
  4. TPU 出货 4M 的兑现度:测算前提包括 TSMC N3P 产能、HBM3e 供给、Anthropic 等大客户落地节奏;任一环节延期都将影响下游光模块/OCS 弹性。
  5. 代际跳跃风险:CPO(共封装光学)与 OCS 是互补还是替代关系存在分歧;若 CPO 在 2027-2028 年快速放量,OCS 的"骨干价值"可能被部分稀释。[内资研报]

六、关键跟踪指标

  1. Google 2026 TPU 实际出货量:是否达到/接近 400 万颗(决定光模块/OCS 弹性)。
  2. 800G+ 光模块出货占比:2026 年是否突破 60%(TrendForce 预测);1.6T 占比起量节奏。
  3. Lumentum OCS 营收:2026Q4 是否兑现 >$100M;积压订单是否突破 $500M(前为 $400M)。
  4. A 股 OCS 玩家关键节点
  5. 赛微电子 MEMS-OCS 北京亦庄产线试产 → 量产时间表
  6. 凌云光 DLBS OCS 国内云厂商首单(百度/阿里/腾讯)
  7. 英唐智控 光隆集成收购完成与整合进度
  8. OCS 端口密度版本:48×144 vs 48×600 哪种成为 Google 主流(决定单机 BOM 与厂商组合)。
  9. TPU v8/v8i 节奏:FP4 引入是否进一步提升单 Pod 算力密度(拉动单 Pod 光端口数)。

七、横向比较:与 NVIDIA Scale-up 路线的分歧

维度 Google TPU v7 + Apollo OCS NVIDIA GB200/GB300 NVLink
Scale-up 介质 光(OCS + 光模块)+ 短铜混合 主要为铜缆 + 电交换(NVL72/NVL576)
单 Pod 规模 9216 chip / 1.77 PB HBM NVL72: 72 chip;NVL576 路线规划中
网络代际折旧 OCS 骨干长寿命(不绑定 SerDes 速率) 电交换芯片绑代际,折旧压力大
单位 TCO(内部口径) 较 GB200/GB300 低 30–44% 基线
光模块依赖度 极高(Pod 内+Pod 间均光化) 较低(铜缆为主,跨 Pod 光化)

路线分歧核心:Google 押注"全光骨干 + 透明速率演进",NVIDIA 押注"高密度铜+电交换 + CPO 兜底";A 股光模块/OCS 板块的最大边际利好来自 Google 路线的成功。[内资研报] [外资研报]

八、来源

  • [Google 官方] Google Cloud Blog: "Inside the Ironwood TPU codesigned AI stack" (2025-11);"3 things to know about Ironwood, Google's latest TPU";TPU7x Documentation
  • [SemiAnalysis] "Google OCS Apollo: The >$3 Billion Game-Changer in Datacenter Networking" (2023-03);"Google TPUv7: The 900lb Gorilla In the Room" (2025-11)
  • [arXiv 2208.10041] Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale
  • [HPCwire] "Google Aims to Flip the Script on AI Inference with New Ironwood TPUs" (2025-11-10)
  • [The Register] "TPU v7, Google's answer to Nvidia's Blackwell is nearly here" (2025-11-06)
  • [DCD] Datacenter Dynamics: "Mission Apollo: Behind Google's optical circuit switching revolution"
  • [TrendForce] "Google's High-Speed Interconnect Architecture to Push 800G+ Optical Transceiver Share Past 60% by 2026" (2026-02-10);"Google Unveils 7th-Gen TPU Ironwood with 9,216-Chip Superpod" (2025-11-07)
  • [内资研报] 通信行业投资策略:谷歌 TPU v7 与 OCS 光交换,架构革新与产业链机遇 (2026-02-13);通信行业专题报告:数据中心互联技术专题 (2026-02-26);互联网行业谷歌链专题:AI 全栈式创新 (2025-11-06);中际旭创深度研究 (2026-04-22);英唐智控首次覆盖报告 (2026-02-26);凌云光业绩解读会路演纪要 (2026-04-29)
  • [外资研报] US Semiconductors and Hardware: Weekly Investor Pulse: Google TPUs & TSMC Technology Roadmap (2026-04-24)
  • [第三方报告] 2026 人工智能行业发展蓝皮书 (2026-04-26);面向大规模智算集群场景的光互连技术白皮书 (2025-10-24)