BCM56780 · TSMC 7 nm · 1RU 32×400G avec iPo-DWDM

Broadcom Trident 4 Commutateurs Trident 4 12.8 Tbps · 32 × 400G · le leaf DC moderne.

Deux plateformes ouvertes 1RU 32×400G validées sur OcNOS-DC : Edgecore AS9726-32DB and UfiSpace S9300-32D. La puce de classe DC-leaf avec marge iPo-DWDM : optiques cohérentes 400G ZR/ZR+ directement dans la cage, sans étagère de transpondeurs requise.

12.8Tbps
Capacité du switch
32×400G
Radix de ports natif
1RU
Format
2SKUs
OcNOS-Validated
400GZR
Prêt pour iPo-DWDM
01
Les switchs
Matériel ouvert sous Trident 4

Deux SKU jumeaux en 1RU. Une seule image OcNOS-DC.

Même classe architecturale (32 × QSFP-DD sur Broadcom BCM56780), ODM différents. Les deux sont livrés préchargés en ONIE et exécutent la même image OcNOS-DC. Les différences tiennent au cadre d'approvisionnement et à la relation fournisseur qui convient à votre parc. Chaque fiche renvoie à la datasheet complète du fournisseur (PDF, hébergé localement).

Edgecore· série DCS
DC leaf · 400G

AS9726-32DB

Validé sur OcNOS-DC · ONIE préchargé
Ports
32 × QSFP-DD (400G)Breakout : 2×200 / 4×100 / 8×50 (jusqu'à 256 logiques)
Form
1RU · 438.4 × 500 × 43.4 mm
Power
~1500 W typique · redondance hot-swap~47 W par cage QSFP-DD
CPU
Intel Xeon D · 2 Go RAM
▌ À choisir lorsque

Leaf DC 400G avec marge iPo-DWDM : optiques enfichables 400G ZR/ZR+ directement dans le spine, sans transpondeur. SKU de marque Edgecore.

UfiSpace· série S9300
DC leaf · 400G

S9300-32D

Validé sur OcNOS-DC · ONIE préchargé
Ports
32 × QSFP-DD (400G)Breakout : 2×200 / 4×100 / 8×50 (jusqu'à 256 logiques)
Form
1RU · 440 × 500 × 43.5 mm
Power
~1500 W typique · redondance hot-swap~47 W par cage QSFP-DD
CPU
Intel Xeon D · 2 Go RAM
▌ À choisir lorsque

Même classe architecturale que l'AS9726-32DB. Choisissez selon votre relation ODM, l'économie de la BoM, ou là où les plateformes UfiSpace dominent déjà le reste de votre parc.

· Comment TD4 s'intègre au reste du portefeuille OcNOS

vs Tomahawk 4Le TD4 offre la moitié de la capacité dans la moitié de l'espace rack : classe leaf DC. TH4 (25,6 Tbps) convient aux rôles spine/agrégation où la profondeur de buffer compte.
vs Tomahawk 5TD4 is 400G; TH5 (51,2 Tbps) est de 800G. Associez-les : leaf TD4, spine TH5, dans les fabrics IA de plus grande envergure.
vs Trident 3Le TD3 plafonne aux ports 100G ; le TD4 est la voie de mise à niveau moderne en 400G. Compatibilité OcNOS-DC directe.
avantage iPo-DWDMCages QSFP-DD avec le budget de puissance pour le coherent 400G ZR/ZR+. DCI métro sans tiroir de transpondeur.
02
Au cœur du silicium
Silicon marchand de classe leaf DC

Trident 4 : conçu spécifiquement pour le rôle de leaf en DC.

The BCM56780 Trident 4 est l'ASIC marchand DC-leaf de 12,8 Tbps de Broadcom : la moitié de la capacité du Tomahawk 4 à un coût par port nettement inférieur. Le radix natif est 32 × 400G (ou 64 × 200G, 128 × 100G via breakout). Conçu sur TSMC 7 nm avec SerDes 50G PAM4 : 256 voies, 8 voies par cage QSFP-DD.

Ce qui fait du TD4 une puce spécifique aux leaves plutôt qu'un TH-series plus petit : optimisé pour le forwarding est-ouest plutôt que pour l'agrégation spine. Pool de buffers plus petit (correspond aux schémas de charge leaf), dimensionnement de table plus serré pour le rôle VTEP VXLAN/EVPN, enveloppe de puissance par port plus faible. Le compromis est assumé. Le TD4 n'est pas le bon spine pour un cluster de 16k GPU, mais il en est le bon leaf.

Recoupé avec les données de Broadcom Page produit BCM56780.

ProcessTSMC N7 SeriesStrataXGS RoleDC Leaf SerDes50G PAM4 · 256 lanes Optiquesprêt pour iPo-DWDM

· À quoi ressemble 32 × 400G

Die BCM5678012,8 Tbps
256 voies × 50G PAM4 = 12,8 Tbps. Huit voies par cage → 400G. Boîtier 1RU · un budget d'environ 47 W/cage prend en charge le 400G ZR coherent.
Quatre choix de conception qui comptent

Pourquoi le TD4 a le bon format pour le leaf DC moderne.

Différent des séries TH de manière délibérée, chaque choix étant optimisé pour la charge de travail du leaf plutôt que pour la capacité du spine.

PRINCIPLE 01

Dimensionné pour l'est-ouest.

12,8 Tbps en 1RU est la forme naturelle d'un leaf de DC : il gère 32 × 400G de liaisons montantes vers le spine plus 64 × 100G de liaisons descendantes vers les serveurs (via breakout) sans surdimensionner le silicon pour une capacité qui ne sera pas utilisée.

12.8 Tbps · 1RU
PRINCIPLE 02

Budget de cages iPo-DWDM.

Les cages QSFP-DD de l'AS9726-32DB et du S9300-32D sont dimensionnées pour environ 47 W/port, suffisant pour les optiques cohérentes enfichables 400G ZR et OpenZR+. Branchez un module cohérent directement dans le leaf pour un DCI métro sans transpondeur.

~47 W/cage · prêt pour 400G ZR
PRINCIPLE 03

EVPN-VXLAN au débit ligne.

Encapsulation/décapsulation VXLAN accélérée par le matériel avec une mise à l'échelle VTEP appropriée. Multi-homing ESI-LAG sur le leaf, IRB symétrique/asymétrique et plan de contrôle BGP EVPN complet sur OcNOS-DC.

VXLAN VTEP · ESI-LAG
PRINCIPLE 04

Le même NOS que la spine.

La même image OcNOS-DC qui s'exécute sur les spines TH4 et TH5 fonctionne sur les leaves TD4. Un seul modèle de configuration, une seule surface d'automatisation, un seul pipeline de télémétrie sur l'ensemble du fabric. Aucun OS spécifique aux leaves à maintenir.

OcNOS-DC · image unifiée
03
Saut de génération
Trident 3 → Trident 4

Capacité quadruplée. Débit par port quadruplé. Même rôle de DC leaf.

Le TD3-X7 (3,2 Tbps · 32×100G · 16 nm · 25G NRZ) était le leaf de prédilection de l'ère 2018-2022. Le TD4 a quadruplé la fiche technique au même format 1RU. Le rôle n'a pas changé : le leaf de DC moderne est juste plus grand.

Capacité de commutation
3,2 Tbps 12,8 Tbps

4× de capacité dans le même 1RU. Même espace en rack, quatre fois plus de débit.

Débit de port natif
100G QSFP28 400G QSFP-DD

Vitesse par port multipliée par 4. Même radix de 32 ports, mais chaque port transporte quatre fois plus.

Nœud de processus
16 nm 7 nm

Réduction en deux étapes. La puissance par Gbps chute considérablement : ce qu'exige le coherent 400G ZR.

Optique cohérente
Pluggables SR/LR 400G ZR/ZR+

Le budget de la cage QSFP-DD héberge la cohérence. L'iPo-DWDM est arrivé à l'époque du TD4.

Continuity: la même image OcNOS-DC tourne sur TD3 et TD4. Le renouvellement brownfield préserve intacts les configs EVPN, les peerings BGP, les souscriptions gNMI et les playbooks Ansible : la capacité quadruple, le modèle opérationnel reste le même. Page Trident 3 →
04
Ce que livre OcNOS-DC
OcNOS-DC sur ce silicon

Leaf de niveau opérateur. Optique coherent. RoCEv2 sans perte.

Le leaf TD4 reçoit la même surface de fonctionnalités OcNOS-DC que le spine, plus la mécanique iPo-DWDM pour un DCI sans transpondeur lorsque le leaf fait aussi office de point d'extension métro.

EVPN-VXLAN Leaf

BGP EVPN avec IRB symétrique/asymétrique.

Plan de contrôle EVPN complet conforme à la RFC 7432 sur le leaf. Multi-homing ESI-LAG pour le rattachement de serveurs actif/actif, convergence par mass-withdraw, dérivation automatique des route-targets. Le spine TH et le leaf TD partagent la même image EVPN, ce qui leur permet de peerer directement.

iPo-DWDM

400G ZR / ZR+ directement dans la cage.

Optiques cohérentes enfichables avec accord DWDM complet, accord FEC et management OIF/CMIS, le tout piloté via gNMI OcNOS. Aucun shelf transpondeur requis pour le DCI métro.

RoCEv2 sans perte

PFC + ECN + DCQCN.

Boîte à outils RoCEv2 complète sur le leaf : mêmes paramètres par défaut réglés pour les opérations collectives xCCL (NCCL / RCCL / oneCCL) que sur le spine TH5.

Télémétrie en streaming

gNMI / OpenConfig.

Compteurs par port, état de la couche optique (BER, dispersion, OSNR pour ZR), comptes de pauses PFC. À brancher sur Prometheus/Grafana.

Réseau réel

BGP · OSPF · IS-IS · SR-MPLS.

Pile de routage complète sur la leaf. Traitez-la comme un vrai routeur, pas comme un switch L2 plat.

Surface de fonctionnalités validée

La même image OcNOS-DC que le reste de la fabric.

Routage Layer 3 · L1/L2 · primitives de fabric IA · Multicast · QoS · Sécurité · Matériel · Gestion. Validation par plateforme visible sur la OcNOS Feature Matrix publique.

EVPN-VXLAN ESI-LAG RoCEv2 / PFC DCQCN 400G ZR / ZR+ BGP / OSPF / IS-IS SR-MPLS gNMI / NETCONF ZTP
Day-0 to Day-2

ZTP. gNMI on-change. NETCONF + YANG. DCBX.

Mettez en service un leaf TD4 dans le rack avec un provisioning zero-touch. Diffusez chaque compteur, y compris l'état de la couche optique cohérente, vers votre stack d'observabilité. Aucun script de raccord.

ZTP IPv4/IPv6 gNMI NETCONF OpenConfig YANG Optiques CMIS Ansible Provider Terraform
Qui construit cette stack

Trois profils opérateurs. Un seul silicon de classe leaf.

Le même silicon TD4, trois rôles DC différents, chacun exploitant des facettes différentes de la même puce.

Opérateur DC · Leaf 400G

La montée en gamme vers du leaf 400G depuis une fabric 100G.

« Notre leaf DC est aujourd'hui en 100G QSFP28. Les densités de rack augmentent. Il nous faut du 400G jusqu'au leaf, mais nous ne sommes pas prêts à reconcevoir le spine. »

Leaves TD4 en 32×400G avec breakout 4× vers des serveurs 100G. Même langage de configuration EVPN-VXLAN que le fabric TD3 qu'ils remplacent. Même image OcNOS-DC. Le spine ne change pas.

DC · Renouvellement Leaf
DCI métro · iPo-DWDM

Extension métro sans transpondeur.

« Nous avons deux DC distants de 80 km. Le groupe optique veut retirer le shelf transpondeur. Le groupe réseau veut du 400G entre eux. Les achats veulent une seule boîte, pas deux couches. »

Leaf TD4 avec des optiques enfichables 400G ZR directement dans les cages QSFP-DD. L'EVPN inter-DC étire le fabric L2/L3. La couche optique s'effondre dans la couche IP. Une seule boîte, les deux couches.

DCI · Metro
Cluster IA · Petit / Moyen

Cluster GPU single-pod sur une fabric à un seul niveau.

« Notre cluster compte 32 serveurs GPU avec des NIC 100G. Nous n'avons pas besoin d'un Clos multi-niveaux. Mais nous voulons du RoCEv2 sans perte et la possibilité de croître. »

Une paire de commutateurs TD4 forme un fabric à un seul étage pour un cluster mono-pod en NIC 100G (breakout 4×). RoCEv2 sans perte du serveur au commutateur, DCQCN réglé pour xCCL, ESI-LAG pour le calcul multi-homed. Insérez une spine TH4 ou TH5 pour passer en multi-pod.

DC · Petite AI Fabric
Questions fréquentes

Les questions que les architectes posent vraiment.

Deux plateformes à matériel ouvert 1RU 32×400G : Edgecore AS9726-32DB and UfiSpace S9300-32D. Même classe architecturale (32×QSFP-DD sur Broadcom BCM56780), des ODM différents. Les deux sont livrés avec ONIE préchargé et exécutent la même image OcNOS-DC que les spines TH5 et les switches d'agrégation deep-buffer TH4.
Le TD4 (BCM56780) offre 12,8 Tbps en 1RU avec 32×400G, soit la moitié de la capacité du TH4 (BCM56996) qui offre 25,6 Tbps en 2RU avec 64×400G. Le TD4 est le DC-leaf-class chip : boîtier plus petit, consommation plus faible, coût par port inférieur. Le TH4 est le spine/aggregation-class puce avec deep buffer HBM optionnel. Dans une fabric leaf-spine : TD4 dans le leaf, TH4 ou TH5 dans le spine. La même image OcNOS-DC s'exécute sur les deux.
Oui, lorsque le cluster est suffisamment petit. Un spine de 12,8 Tbps prend en charge une fabric mono-niveau à 32 leaves avec 32×400G de liaisons montantes, dimensionnée pour des clusters dans la plage de 256 à 512 GPU avec des NIC 100G, ou jusqu'à ~128 GPU avec des NIC 400G. Au-delà, le spine requiert une capacité TH4 (25,6 Tbps) ou TH5 (51,2 Tbps) pour une mise à l'échelle Clos correcte. OcNOS-DC gère les trois de façon identique.
IP-over-DWDM. L'AS9726-32DB comme le S9300-32D disposent de Cages QSFP-DD avec le budget de puissance pour les optiques coherent enfichables 400G ZR et OpenZR+. Branchez un module cohérent directement dans le leaf : pas d'étagère de transpondeur séparée, pas de muxponder. Pour un DCI métro entre deux switchs leaf, la couche optique se fond dans la couche IP. Économise du CapEx, de l'OpEx et des U de rack.
Oui. Le TD4 dispose de la même architecture de buffer partagé Broadcom et des mêmes primitives PFC + ECN que la série TH. OcNOS-DC fournit PFC, ETS, Dynamic ECN, DCQCN ainsi que PFC Deadlock Detection & Recovery sur les plateformes TD4. Le routage adaptatif (DLB) est pris en charge par l'ASIC et configurable. La capacité de 12,8 Tbps fait du TD4 un bon choix pour le leaf dans une fabric IA de petite à moyenne taille : RoCEv2 sans perte du serveur au leaf, puis sans perte à travers le spine sur TH4 ou TH5.
Pour des ports 800G aujourd'hui (utilisez le TH5). Pour un leaf DC 100G/25G pur où le cluster est en dessous de ~64 serveurs (le TD3-X7 est bien moins cher). Pour la périphérie SP ou le cœur d'opérateur (utilisez Qumran ou Jericho : jeu de fonctionnalités différent). Pour des rôles DCI où le boîtier doit absorber des rafales profondes (utilisez le TH4 avec HBM). Le créneau idéal du TD4 est « un leaf DC 400G moderne avec une marge iPo-DWDM ».
Une note de saisie. Le numéro de référence public de Broadcom pour le Trident 4 est BCM56780; BCM56990 is Tomahawk 4. L'enregistrement administratif HCL peut utiliser un libellé non standard, mais le silicon livré dans les AS9726-32DB et S9300-32D est la famille BCM56780 Trident 4. Recoupez avec les datasheets Edgecore et UfiSpace liées si les numéros de référence exacts comptent pour votre approvisionnement.

Vous concevez un leaf DC 400G avec marge iPo-DWDM ?

Session d'architecture de 30 minutes avec un architecte réseau OcNOS. Apportez votre plan de DC, votre nombre de serveurs et vos exigences DCI, et repartez avec une BoM dimensionnée autour des AS9726-32DB / S9300-32D et un plan de placement face au spine de classe TH.