400G ZR / ZR+ Coherent DCI

跨越兩個數據機房的 AI 訓練任務,過去在兩端各需要一套轉發器機架。藉助 400G ZR 和 ZR+ 相干可插拔光模組,長距接口可直接以與灰光 400G 光模組相同的 QSFP-DD 形態插入 spine,OcNOS-DC 對兩者均提供支持,並通過 EVPN inter-DC 在該鏈路上承載租戶流量。

兩張網路,一種光模組

每臺 spine 在其某個 QSFP-DD 籠位中插入一個 400G ZR 或 ZR+ 相干模組。光纖直接接入城域/長途 DWDM 線路系統。EVPN 跨資料中心隧道在該鏈路上承載 VXLAN 租戶流量,並在兩端分別跟蹤 OcNOS-DC fabric。

AI 資料中心之間的 400G ZR/ZR+ 相干 DCI 兩臺 AI 資料中心設備,左右各一。每臺均包含 spine 和 leaf 交換機。兩臺 spine 通過一條 400G ZR/ZR+ 相干可插拔光鏈路相連,以橫跨間隙的波形圖案表示。EVPN 資料中心間隧道符號疊加在該鏈路之上。底部條帶列出了關鍵的 DCI 特性。 DATA CENTER A · AI POD DATA CENTER B · AI POD Spine-AQSFP-DD ZR+ 埠 Spine-BQSFP-DD ZR+ 埠 400G ZR / ZR+ 相干 · DWDM 線路 EVPN 跨資料中心隧道 Leaf-A1 Leaf-A2 Leaf-A3 Leaf-B1 Leaf-B2 Leaf-B3 GPU pod · 站點 A GPU pod · 站點 B 400G COHERENT PLUGGABLE · TRANSPONDER-FREE · OPENZR+ · EVPN INTER-DC

相干可插拔光模組為何改變了 DCI 的經濟性

在相干可插拔光模組出現之前,任何超過約 10 km 的 inter-DC 鏈路都需要一臺轉發器:位於交換機與線路系統之間的獨立光設備。這意味著每個站點要多一臺設備、多一層廠商關係、多一套備件,以及管理獨立光層所帶來的運維複雜度。 相干可插拔模組將上述一切收納進一個可裝入 spine 自身的 QSFP-DD 模組中。

如今有兩種形態值得關注。 400G ZR 覆蓋最長約 120 km 的無放大或單放大城域光纖,非常適合同一城域內的兩座 AI 機房。 400G ZR+ (依據 OpenZR+ MSA)支持更高的發射功率、FEC 調諧以及額外的調製模式,可覆蓋更長距離的傳輸,或穿越外部放大器和 ROADM 系統的鏈路。兩者均可插入同一 QSFP-DD 籠;選擇取決於你的鏈路預算。

ZR 與 ZR+ 一覽

400G ZR: IEEE 802.3ct

城域 DCI(≤ 約 120 km)

行業標準的 400G 相干:城域短距、固定配置、更低的每埠成本。適用於同一城域區域內的兩座 AI 機房。

400G ZR+: OpenZR+ MSA

長距離/放大 DCI

可調製調度(從 16-QAM 降至 QPSK)、更高的發射功率、用於更遠傳輸距離的 oFEC。傳輸距離取決於線路系統和 FEC 調優:單跨段通常為 400–800 km,在多跨段 DWDM 系統上可達約 1200–1800 km。適合跨區域 AI fabric 擴展。

OcNOS-DC 實現方案

原生可插拔模組

骨幹層採用 QSFP-DD

400G ZR 和 ZR+ 可插拔模組可直接插入受支持的 spine 平台:Edgecore AS9736-64D、AS7726-32X、UfiSpace S9700 系列,以及其他列明的、配備 QSFP-DD 相干能力埠的 HCL 設備。

CMIS 管理

標準化控制

OcNOS 通過 CMIS(Common Management Interface Specification)與模組通信:設置頻率、調製方式、發射功率、線路 FEC;並回讀 DDM、BER、OSNR 用於診斷。

EVPN Inter-DC

租戶隧道擴展

VXLAN VNI 與 EVPN 路由可跨相干鏈路傳播。兩套網路如同一套擴展網路,為租戶提供 L2 與 L3 服務。

遙測

Coherent-aware gNMI

逐模組的 pre-FEC BER、post-FEC BER、tx/rx 功率、頻率偏移、OSNR 和 CMIS 狀態均通過 gNMI / OpenConfig 流式輸出,並匯入您現有的可觀測性儀錶盤。

Operations

相同的 NOS,相同的技能

對 OcNOS-DC 而言,DCI 鏈路只是又一個 L3 接口。BGP、BFD、路由策略、段路由:一切運作方式都與普通 400G 埠完全相同。

硬體

已驗證的光模組

針對硬體兼容性列表(Hardware Compatibility List)中的平台對可插拔模組進行了認證。我們測試的是組合,而不僅僅是孤立地測試任一側。

這為 AI 架構師帶來的價值

  • No transponder shelf. 光接口直接位於 spine 埠內。相較基於 transponder 的 DCI,CapEx 和機架空間大幅下降。
  • 單一管理平面。 相干診斷數據與其餘 fabric 遙測數據通過同一條 gNMI 饋送傳輸。無需再學習一套獨立的光網路 OSS。
  • GPU 規模的網路擴展。 接入 spine 的 400G 提供了足夠餘量,單條長距鏈路即可承載跨 DC 訓練任務的可觀一部分流量;綁定多個 ZR+ 模組即可獲得更高容量。
  • 開放硬體路徑。 ZR/ZR+ 是一項 MSA,而非廠商私有方案。來自 Coherent(Lumentum)、Innolight、Cisco、Ciena 等的光模組均可通過 CMIS 互操作。
  • 標準 EVPN 跨 DC 互聯。 無需學習新的控制平面。您已在 fabric 內部使用的同一套 EVPN 工具,可將租戶跨 WAN 承載。

正在為 AI fabric 設計 DC 間互聯?請把您的鏈路預算交給我們。

申請技術演示 →