BCM56780 · TSMC 7 nm · 1RU 32×400G 搭配 iPo-DWDM

Broadcom Trident 4 Trident 4 交換機 12.8 Tbps · 32 × 400G · 現代化 DC leaf。

兩款已在 OcNOS-DC 上驗證的開放 1RU 32×400G 平台: Edgecore AS9726-32DB and UfiSpace S9300-32D。具備 iPo-DWDM 餘量的 DC-leaf 級晶片:400G ZR/ZR+ 相干光模組可直接插入埠籠,無需 transponder shelf。

12.8Tbps
交換容量
32×400G
原生埠密度
1RU
外形規格
2SKUs
OcNOS-Validated
400GZR
iPo-DWDM 就緒
01
交換機
運行 Trident 4 的開放硬體

兩款 1RU 同系列 SKU。一個 OcNOS-DC 鏡像。

相同的架構類別(基於 Broadcom BCM56780 的 32 × QSFP-DD),不同的 ODM。兩者均出廠預裝 ONIE 並運行相同的 OcNOS-DC 鏡像。區別在於採購定位以及哪種供應商關係更適合您的機群。每張卡片均連結至完整的供應商數據表(PDF,本地託管)。

Edgecore· DCS 系列
DC leaf · 400G

AS9726-32DB

經 OcNOS-DC 驗證 · 預裝 ONIE
Ports
32 × QSFP-DD (400G)拆分:2×200 / 4×100 / 8×50(最多 256 個邏輯埠)
Form
1RU · 438.4 × 500 × 43.4 mm
Power
典型功耗約 1500 W · 熱插拔冗餘每個 QSFP-DD 埠約 47 W
CPU
Intel Xeon D · 2 GB 記憶體
▌ 適用場景

具備 iPo-DWDM 餘量的 400G DC leaf:400G ZR/ZR+ 可插拔光模組可直接插入 spine,無需 transponder。Edgecore 品牌 SKU。

UfiSpace· S9300 系列
DC leaf · 400G

S9300-32D

經 OcNOS-DC 驗證 · 預裝 ONIE
Ports
32 × QSFP-DD (400G)拆分:2×200 / 4×100 / 8×50(最多 256 個邏輯埠)
Form
1RU · 440 × 500 × 43.5 mm
Power
典型功耗約 1500 W · 熱插拔冗餘每個 QSFP-DD 埠約 47 W
CPU
Intel Xeon D · 2 GB 記憶體
▌ 適用場景

與 AS9726-32DB 屬於同一架構類別。可按 ODM 合作關係、BoM 經濟性,或根據 UfiSpace 平台在您現有設備群其餘部分中已佔主導的情況進行選型。

· TD4 在 OcNOS 產品組合中的定位

vs Tomahawk 4TD4 以一半的機架空間提供一半的容量:DC leaf 級別。 TH4(25.6 Tbps) 適用於注重深緩衝的脊層/匯聚角色。
vs Tomahawk 5TD4 is 400G; TH5(51.2 Tbps) 即 800G。可將二者搭配:在更大規模的 AI 網路中,採用 TD4 leaf 與 TH5 spine。
vs Trident 3TD3 最高支持 100G 埠;TD4 是現代的 400G 升級路徑。可直接兼容 OcNOS-DC。
iPo-DWDM 優勢QSFP-DD 光纖籠,具備支持 400G ZR/ZR+ 相干的功耗預算。無需轉發器機架即可實現城域 DCI。
02
深入晶片內部
資料中心 leaf 級通用晶片

Trident 4:專為 DC leaf 角色打造。

The BCM56780 Trident 4 是 Broadcom 的 12.8 Tbps DC-leaf 通用 ASIC:容量為 Tomahawk 4 的一半,但單埠成本大幅更低。原生基數為 32 × 400G (或通過 breakout 實現 64 × 200G、128 × 100G)。基於 TSMC 7 nm 工藝、採用 50G PAM4 SerDes:256 lane,每個 QSFP-DD cage 8 lane。

為何 TD4 是一款專用於 leaf 的晶片,而非更小型的 TH 系列晶片: 針對東西向轉發而非 spine 匯聚進行了最佳化。更小的緩衝池(匹配 leaf 工作負載模式)、針對 VXLAN/EVPN VTEP 角色更緊湊的表規模、每埠更低的功耗。這種取捨是經過深思熟慮的。TD4 不適合作為 16k-GPU 叢集的 spine,但它正是這種叢集的理想 leaf。

已與 Broadcom 的 BCM56780 產品頁面.

ProcessTSMC N7 SeriesStrataXGS RoleDC Leaf SerDes50G PAM4 · 256 通道 光模組iPo-DWDM 就緒

· 32 × 400G 是怎樣的形態

BCM56780 裸片12.8 Tbps
256 lane × 50G PAM4 = 12.8 Tbps。每個 cage 8 lane → 400G。1RU 設備 · 約 47 W/cage 的功耗預算可支持 400G ZR 相干。
四項關鍵設計選擇

為何 TD4 是現代 DC leaf 的理想形態。

與 TH 系列有著刻意為之的差異,每項選擇都針對 leaf 工作負載而非 spine 容量進行最佳化。

PRINCIPLE 01

為東西向流量量身定製。

1RU 內提供 12.8 Tbps,正是 DC leaf 的天然形態:可承載 32 × 400G 上行至 spine,外加 64 × 100G 下行至伺服器(經 breakout 拆分),無需為用不上的容量過度配置晶片。

12.8 Tbps · 1RU
PRINCIPLE 02

iPo-DWDM 光籠預算。

AS9726-32DB 與 S9300-32D 上的 QSFP-DD 籠位按約 47 W/埠設計,足以支持 400G ZR 和 OpenZR+ 可插拔相干光模組。將相干模組直接插入 leaf,即可實現免轉發器的城域 DCI。

約 47 W/籠位 · 支持 400G ZR
PRINCIPLE 03

線速 EVPN-VXLAN。

硬體加速的 VXLAN 封裝/解封裝,配合規範的 VTEP 擴展能力。在 leaf 上實現 ESI-LAG 多歸屬、對稱/非對稱 IRB,以及 OcNOS-DC 上完整的 BGP EVPN 控制平面。

VXLAN VTEP · ESI-LAG
PRINCIPLE 04

與 spine 採用相同的 NOS。

運行在 TH4 和 TH5 spine 上的同一套 OcNOS-DC 鏡像,同樣運行在 TD4 leaf 上。整個 fabric 共用一套配置模型、一個自動化界面、一條遙測管線。無需維護 leaf 專用的 OS。

OcNOS-DC · 統一鏡像
03
代際跨越
Trident 3 → Trident 4

容量翻兩番。埠速率翻兩番。同樣的資料中心 leaf 任務。

TD3-X7(3.2 Tbps · 32×100G · 16 nm · 25G NRZ)是 2018–2022 年代的主力 leaf。TD4 在相同的 1RU 佔用空間內將規格指標翻了四倍。角色並未改變:現代 DC leaf 只是變得更大了。

交換容量
3.2 Tbps 12.8 Tbps

在相同 1RU 下容量提升 4 倍。相同的機架空間,四倍的吞吐量。

原生埠速率
100G QSFP28 400G QSFP-DD

每埠速率提升 4 倍。同樣的 32 埠基數,但每埠承載量翻四倍。

製程節點
16 nm 7 nm

兩級製程收縮。每 Gbps 功耗大幅下降:正是 400G ZR 相干所需。

相干光模組
SR/LR 可插拔模組 400G ZR/ZR+

QSFP-DD 籠位預算可承載相干光模組。iPo-DWDM 是 TD4 時代的產物。

Continuity: 同一個 OcNOS-DC 鏡像可同時運行在 TD3 和 TD4 上。存量網路升級可完整保留 EVPN 配置、BGP peering、gNMI 訂閱和 Ansible playbook:容量翻兩番,運維模型保持不變。 Trident 3 頁面 →
04
OcNOS-DC 交付內容
此晶片上運行 OcNOS-DC

電信等級葉層。相干光模組。無損 RoCEv2。

TD4 leaf 獲得與 spine 相同的 OcNOS-DC 功能面,並額外配備 iPo-DWDM 機制,使 leaf 在兼作城域擴展點時實現免轉發器的 DCI。

EVPN-VXLAN Leaf

採用對稱/非對稱 IRB 的 BGP EVPN。

在 leaf 上運行完整的 RFC 7432 EVPN 控制平面。支持 ESI-LAG 多歸屬以實現伺服器主/主接入、批量撤銷收斂以及 route-target 自動派生。TH spine 與 TD leaf 共用同一 EVPN 鏡像,因此可直接建立對等。

iPo-DWDM

400G ZR / ZR+ 直接接入籠內。

可插拔相干光模組支持完整的 DWDM 調諧、FEC 調諧以及 OIF/CMIS 管理,全部通過 OcNOS gNMI 驅動。城域 DCI 無需轉發器機框。

無損 RoCEv2

PFC + ECN + DCQCN.

葉交換機上提供完整 RoCEv2 工具集:預設配置與 TH5 spine 一致,均針對 xCCL (NCCL / RCCL / oneCCL) 集體通信調優。

串流遙測

gNMI / OpenConfig.

每埠計數器、光層狀態(針對 ZR 的 BER、色散、OSNR)、PFC pause 計數。可接入 Prometheus/Grafana。

真實網路

BGP · OSPF · IS-IS · SR-MPLS.

leaf 上的完整路由協議棧。將其視為真正的路由器,而非扁平的 L2 交換機。

已驗證的特性範圍

與 fabric 其餘部分採用相同的 OcNOS-DC 鏡像。

Layer 3 路由 · L1/L2 · AI/ML fabric 原語 · 組播 · QoS · 安全 · 硬體 · 管理。各平台的驗證情況可在公開的 OcNOS Feature Matrix 上查看。

EVPN-VXLAN ESI-LAG RoCEv2 / PFC DCQCN 400G ZR / ZR+ BGP / OSPF / IS-IS SR-MPLS gNMI / NETCONF ZTP
Day-0 to Day-2

ZTP. gNMI on-change. NETCONF + YANG. DCBX.

通過零接觸部署(ZTP)在機架中上線 TD4 leaf。將每一項計數器(包括相干光層狀態)流式上送到您的可觀測性棧,無需任何粘合腳本。

ZTP IPv4/IPv6 gNMI NETCONF OpenConfig YANG CMIS 光模組 Ansible Terraform provider
誰構建了這套技術棧

三類電信業者畫像。一款 leaf 級晶片。

同一 TD4 晶片,三種不同的 DC 角色,各自利用同一晶片的不同側面。

DC 電信業者 · 400G 葉節點

從 100G fabric 升級到 400G 葉節點。

「我們的 DC leaf 目前是 100G QSFP28。機架密度不斷攀升。我們需要 400G 接入 leaf,但還沒準備好重新設計 spine。」

TD4 leaf 提供 32×400G,並支持 4× 拆分為 100G 伺服器。與其所替換的 TD3 fabric 採用相同的 EVPN-VXLAN 配置語言,相同的 OcNOS-DC 鏡像,spine 保持不變。

DC · Leaf 更新換代
城域 DCI · iPo-DWDM

免轉發器的城域延伸。

「我們有兩個相距 80 km 的資料中心。光網團隊希望淘汰轉發器機框,網路團隊希望它們之間實現 400G,採購方面則希望只用一臺設備,而不是兩層架構。」

TD4 leaf 直接在 QSFP-DD 籠中插入 400G ZR 光模組。EVPN inter-DC 拉伸 L2/L3 fabric,光層收斂進 IP 層。一臺設備,兩層合一。

DCI · 城域
AI 叢集 · 小型 / 中型

基於單層 fabric 的單 pod GPU 叢集。

"我們的叢集由 32 臺配備 100G NIC 的 GPU 伺服器組成。我們不需要多層 Clos 架構,但希望實現無損 RoCEv2,並保留擴容的選擇空間。"

兩臺 TD4 交換機為基於 100G NIC (4× 拆分) 的單 pod 叢集構成單層 fabric。伺服器到交換機的無損 RoCEv2、針對 xCCL 調優的 DCQCN、適用於多歸屬計算節點的 ESI-LAG。加入 TH4 或 TH5 spine 即可擴展到多 pod。

DC · 小型 AI Fabric
常見問題

架構師真正會問的問題。

兩款開放硬體 1RU 32×400G 平台: Edgecore AS9726-32DB and UfiSpace S9300-32D。同一架構級別(基於 Broadcom BCM56780 的 32×QSFP-DD),ODM 不同。兩者均預裝 ONIE 出貨,並運行與 TH5 spine 及 TH4 深緩存匯聚交換機相同的 OcNOS-DC 鏡像。
TD4(BCM56780)在 1RU 內提供 12.8 Tbps、32×400G,是 TH4(BCM56996)容量的一半,後者在 2RU 內提供 25.6 Tbps、64×400G。TD4 是 DC-leaf-class 晶片:更小的機箱、更低的功耗、更低的每埠成本。TH4 是 spine/aggregation-class 晶片,可選 HBM 深緩衝。在葉脊網路中:葉節點採用 TD4,脊節點採用 TH4 或 TH5。兩者運行相同的 OcNOS-DC 鏡像。
可以,前提是叢集規模足夠小。一臺 12.8 Tbps 的 spine 可支持 32-leaf 的單層組網,配備 32×400G 上行,適用於 100G 網卡下 256–512 GPU 規模的叢集,或 400G 網卡下至多約 128 GPU 的叢集。超出該範圍,spine 則需要 TH4(25.6 Tbps)或 TH5(51.2 Tbps)的容量以實現合理的 Clos 擴展。OcNOS-DC 對這三者的處理方式完全一致。
IP-over-DWDM。AS9726-32DB 與 S9300-32D 均具備 QSFP-DD 籠位,具備承載 400G ZR 和 OpenZR+ 可插拔相干光模組的功耗預算。將相干模組直接插入 leaf:無需獨立的應答機機框,也無需 muxponder。對於兩臺 leaf 交換機之間的城域 DCI,光層即可坍縮進 IP 層。節省 CapEx、OpEx 和機架 U 空間。
是的。TD4 擁有與 TH 系列相同的 Broadcom 共享緩衝架構以及 PFC + ECN 原語。OcNOS-DC 在 TD4 平台上提供 PFC、ETS、Dynamic ECN、DCQCN 以及 PFC 死鎖檢測與恢復功能。自適應路由(DLB)受 ASIC 支持且可配置。12.8 Tbps 的容量使 TD4 非常適合作為中小型 AI 網路架構中的葉節點:從伺服器到葉節點實現 RoCEv2 無損傳輸,再通過 TH4 或 TH5 在脊節點間實現無損傳輸。
適用於當下的 800G 埠(採用 TH5)。適用於叢集規模低於約 64 臺伺服器的純 100G/25G DC leaf(TD3-X7 便宜得多)。適用於 SP 邊緣或電信業者核心(採用 Qumran 或 Jericho:功能集不同)。適用於設備必須吸收深度突發的 DCI 場景(採用帶 HBM 的 TH4)。TD4 的最佳定位是「具備 iPo-DWDM 餘量的現代 400G DC leaf」。
一條數據錄入說明。Broadcom 為 Trident 4 公布的部件號為 BCM56780; BCM56990 is Tomahawk 4。HCL 管理記錄中可能使用了非標準標籤,但 AS9726-32DB 和 S9300-32D 中實際出貨的晶片屬於 BCM56780 Trident 4 系列。如果精確的部件號對您的採購很重要,請與連結的 Edgecore 和 UfiSpace 數據手冊交叉核對。

設計具備 iPo-DWDM 餘量的 400G DC leaf?

與 OcNOS 網路架構師進行 30 分鐘架構研討。請帶上您的 DC 布局、伺服器數量和 DCI 需求,離場時即可獲得一份圍繞 AS9726-32DB / S9300-32D 的尺寸化 BoM,以及相對於 TH 級 spine 的部署規劃。