Una AI fabric abierta — diseñado para lo que su job de training realmente experimenta.
Con miles de aceleradores no se miden los switches en Tbps; se miden job completion time, utilización de GPU y tail latency bajo microbursts. OcNOS-DC alcanza esas cifras sobre merchant silicon abierto con un SLA carrier-grade 24/7: la misma base técnica que los stacks de IA cerrados, sin ninguno de los lock-in.
Llévelo offline. Léalo en un avión.
Dos descargas breves que profundizan más que esta página: la arquitectura de AI fabric lossless y el reference design de data center EVPN-VXLAN.
Fabric IA sin pérdidas basado en Ethernet OcNOS 800G
Fabric RoCEv2 sin bloqueos sobre spines Tomahawk 4/5: niveles de SKU, plataformas validadas y arquitectura de despliegue.
Obtener el briefFabric DC EVPN-VXLAN
Fabric de data center leaf-spine de clase carrier: IRB simétrico, rutas Type-2/Type-5 y gateway anycast distribuido.
Obtener el brief«Mi job de entrenamiento ¿terminará realmente antes?"
A escala, las métricas de red tradicionales pierden significado. Lo que importa es Job Completion Time, utilización de GPU y tail latency bajo microbursts : porque cada minuto que un clúster de varios miles de millones espera a un paso de sincronización es capital quemado.
Las prestaciones lossless y de baja latencia que exige la IA ya no requieren un stack cerrado y propietario. Sobre merchant silicon abierto con SLA carrier-grade, OcNOS-DC alcanza la misma base técnica que las arquitecturas cerradas sin vendor lock-in: gestión de congestión, enrutamiento dinámico por debajo del milisegundo y alineamiento con Ultra Ethernet, ajustados a los patrones a ráfagas del tráfico colectivo. Las GPU dedican su tiempo a procesar datos, no a esperar a la red.
Cada umbral está expuesto, de modo que su equipo pueda ajustarlo frente a tráfico xCCL (NCCL / RCCL / oneCCL) real. A continuación: cada patrón de workload, el mecanismo que lo gestiona y lo que recibe el operador.
→ DLB reasigna flowlets en sub-ms según la profundidad real de las colas.
→ GLB (OcNOS 7.1) puntúa leaf · spine · super-spine.
→ DCQCN (ECN + CNP ajustados para xCCL) limitan la tasa antes del descarte.
→ PFC Watchdog drena automáticamente las colas bloqueadas por puerto.
→ UEC 1.0: packet spray + RDMA multi-path + entrega out-of-order.
→ El switch que adquiera hoy permanecerá en servicio cuando lleguen las NIC UEC.
Benchmark de referencia. DLB eleva la utilización de la fabric desde aproximadamente el 55 % con ECMP estático hasta más del 90 % sobre el mismo hardware, sin uplinks adicionales. Local en cada hop; a nivel de sistema en todo el AllReduce. (Cifra publicada por Broadcom para el flowlet rebalancing, reproducible en TH4/TH5.)
Análisis técnico DLB →800G spine-leaf, lossless de rack a rack.
Un Clos de 3 etapas: underlay eBGP unnumbered, ECMP en cada nivel, PFC/ECN por grupo de prioridad, bus out-of-band aislado para ZTP y telemetría. Pase el cursor sobre cualquier nodo para ver switch, número de puertos y ASIC.
Hover nodes for capability and platform details · Full HCL: 40+ validated platforms at ipinfusion.com/hcl
Cuatro capas de lossless — correcto el primer día.
La mayoría de los fallos en una AI fabric se deben a un grupo de prioridad PFC mal configurado o a un umbral ECN ajustado para cloud, no para RDMA. OcNOS-DC entrega perfiles de buffer RoCEv2 validados por ASIC Broadcom, de modo que el primer AllReduce se ejecuta lossless sin un sprint de tuning.
PFC + ECN — control lossless por priority group
PFC pausa el tráfico por prioridad antes de que los buffers se desborden; ECN marca los paquetes con antelación para ralentizar al emisor. Sin descartes, sin parada generalizada del puerto. PFC sobre L3 para fabrics enrutadas multi-row.
DLB — enrutamiento adaptativo a nivel de flowlet
El ECMP con hash estático colisiona cuando 8 NICs realizan hash sobre el mismo spine. DLB observa la profundidad de cola en tiempo real y redirige los flowlets a rutas menos cargadas en menos de un milisegundo: el AllReduce deja de quedar lastrado por el enlace más lento.
DCBX — configuración de servidor enviada automáticamente vía LLDP
El leaf transmite automáticamente al servidor GPU la configuración PFC y ETS correcta: sin pérdida silenciosa del comportamiento lossless cuando un nodo se reinstala, el modo de fallo más habitual en producción.
Telemetría gNMI on-change — visibilidad sub-segundo
Pausas PFC, marcado ECN, umbrales DCQCN y profundidades de buffer expuestos como sensor paths gNMI on-change, directamente hacia Prometheus / Grafana / OpenTelemetry. Detecte la congestión antes de que detenga un job.
40+ plataformas cualificadas — HCL completo →
El perfil de fabric está listo antes que las NIC. Ese es precisamente el punto.
RoCEv2 es el transporte en producción en 2026; UEC es el paso siguiente. El perfil fabric UEC 1.0 añade packet spray, RDMA multi-path y reenvío compatible con out-of-order, cerrando el límite del hash único que mantenía las generaciones anteriores de RoCE un paso por detrás de InfiniBand en colectivas multi-rail. OcNOS-DC sigue UEC 1.0 fabric perfil hoy, mientras UEC NICs rollout. El punto no es liderar el estándar: todos se están alineando con él. El punto es que el switch adquirido en este trimestre no tendrá que sustituirse cuando llegue la NIC UEC.
Packet spray
Un único flujo utiliza simultáneamente todas las rutas paralelas en lugar de quedar fijado a un único hash ECMP. El ancho de banda multi-rail deja de quedar sin aprovechar.
RDMA multi-path
Los buffers de reordenamiento gestionan la entrega out-of-order en hardware. El control de congestión moderno sustituye a la recuperación de pérdidas basada en NACK en la tail latency.
Mismo hardware, forward path
Las plataformas TH4 y TH5 validadas hoy para OcNOS-DC se extienden a UEC. Sin fork. Sin una segunda línea de SKU. Una fabric, dos generaciones de transporte.
Dónde se sitúa OcNOS-DC — honestamente, por nombre.
La carrera ha convergido en una base común: RoCEv2 lossless, DCQCN, enrutamiento adaptativo, alineamiento con UEC. Todos los entregan. El verdadero elemento diferenciador es perfil de solución : lock-in vertical frente a NOS abierto, hardware cerrado frente a hardware abierto, IB de bucle cerrado frente a Ethernet basado en estándares. Elija el trade-off con el que pueda convivir cinco años.
Cada fila representa un producto real, incluido OcNOS-DC. La cuestión rara vez es una funcionalidad ausente; es el trade-off con el que se va a convivir.
Qué es en realidad — y dónde se detiene.
Un clúster de IA consta de tres capas. La fabric mueve bytes entre switches; el NIC termina RDMA; el Planificador decide qué se ejecuta y dónde. «AI-aware fabric» normalmente significa que un único proveedor agrupa los tres elementos bajo una sola SKU. OcNOS-DC se ocupa de la fabric, expone cada umbral y se mantiene al margen de las capas superiores. La frontera, aquí, queda nombrada.
De qué se ocupa OcNOS-DC.
- Transporte RoCEv2 lossless — PFC + ECN + ETS + DCBX
- DCQCN con umbrales por defecto validados con xCCL, cada parámetro modelado en YANG
- Reasignación de flowlets DLB en sub-ms según la profundidad real de las colas del ASIC
- Puntuación de paths GLB a nivel de toda la fabric (OcNOS 7.1)
- Watchdog anti-deadlock PFC — por puerto, por prioridad
- alineación con el fabric profile UEC 1.0 — forwarding compatible con packet spray
- Telemetría gNMI on-change, OpenConfig YANG, cadencia sub-segundo
Responsabilidad de su proveedor de NIC.
- Implementación y ajuste de colectivos xCCL
- RDMA verbs, queue pairs, lógica de retransmisión
- Endpoint UEC packet spray + reorder buffer (NIC UEC)
- GPU-direct memory access, coordinación NVLink
- Rate limiting por flujo y respuesta a la congestión en el end-host
Responsabilidad de su plataforma de orquestación.
- Asignación de jobs de training, gang scheduling, ventanas de sincronización de gradiente
- Conciencia de epoch / fase de entrenamiento
- Aislamiento de tenants, prioridad de colas, cuotas de recursos
- Asignación de topología en anillo xCCL, afinidad por grupo de rails
- Detección de interferencias cross-job
Cada mecanismo de esta página tiene su propio análisis técnico.
La página anterior sirve para elegir una fabric. Estos contenidos sirven para ajustar una: capturas de paquetes, comportamiento del ASIC, rutas YANG y en qué release train se publica cada funcionalidad.
RoCEv2 + PFC + ECN + DCQCN
Capa de transporte RDMA sin pérdidas para colectivos GPU. Perfiles de buffer preajustados por ASIC Broadcom, valores DCQCN por defecto de clase xCCL, jitter sub-µs bajo carga.
Leer análisis técnico → AI fabric · localAdaptive Dynamic Load Balancing (DLB)
Reasignación de flowlets por debajo del milisegundo basada en telemetría en vivo de profundidad de cola del ASIC. Cierra la brecha de colisiones de hash ECMP en los elephant flows de AllReduce.
Leer análisis técnico → AI fabric · a nivel de fabric OcNOS 7.1Global Load Balancing (GLB)
Puntuación de ruta de extremo a extremo en leaf · spine · super-spine para clústeres de hasta 16k GPU. La capa adaptativa multi-hop que DLB por sí solo no puede ver.
Leer análisis técnico → AI fabric · frontier UEC 1.0Ultra Ethernet (UEC)
Packet spray, RDMA multi-path, entrega out-of-order, control de congestión moderno. La respuesta abierta y basada en estándares a InfiniBand.
Leer análisis técnico → AI fabric · diseños de referenciaTopologías — de single-pod a 16k GPU
Los diseños rail-only y rail-optimized mapean la forma del fabric directamente sobre el patrón multi-NIC de 8 rails de xCCL. Clos de 3 niveles para scale-out multi-pod hasta el techo de 16k GPU. Número de puertos en TH4 / TH5.
Leer análisis técnico → AI fabric · control de congestiónDCQCN — control de congestión RDMA
Marcado WRED ECN, retroalimentación CNP, control de tasa cuantizado. Valores por defecto de clase xCCL listos para usar; cada umbral modelado en YANG para ajuste.
Leer análisis técnico → AI fabric · supervivenciaWatchdog — detección de bloqueo PFC
Un watchdog por puerto y por prioridad detecta ciclos de colas pausadas y vacía automáticamente la cola afectada antes de que los jobs de entrenamiento se bloqueen.
Leer análisis técnico → AI fabric · guía de decisiónInfiniBand vs Ethernet para IA
Guía de decisión específica por workload. Dónde el Ethernet moderno (RoCEv2 + DLB + UEC) cierra la brecha, dónde IB sigue por delante y cómo elegir.
Leer análisis técnico → ObservabilidadTelemetría gNMI en streaming
gNMI Subscribe sobre gRPC, OpenConfig YANG, collectors dial-out. Integraciones con Telegraf, Prometheus y Grafana.
Leer análisis técnico →Tres perfiles de clúster. Tres historias de fabric.
Estructurado a partir de lo que percibe el job, no de las funciones del switch. Elija el perfil más cercano al suyo; los análisis en profundidad contienen las configuraciones.
La ejecución de preentrenamiento de LLM de varias semanas.
AllReduce domina la red. Cada GPU debe mantener una utilización elevada in-collective y sobrevivir a los microbursts sin reiniciar una ejecución de nueve días.
Mecanismos: DCQCN + DLB + watchdog PFC. Rail-optimized para single-pod; Clos de 3 etapas con GLB para scale-out multi-pod.
Resultado: AllReduce a line rate, cero reinicios de collective, JCT dentro de la planificación.
La flota de inferencia de alto throughput detrás de una API pública.
Inferencia en tiempo real donde la tail latency p99 determina el SLO. La inferencia nunca debe quedar en cola tras el reentrenamiento batch, y operaciones necesita visibilidad por flujo en el momento mismo en que la latencia se desvía.
Mecanismos: ETS strict-priority + telemetría gNMI on-change hacia Prometheus / OpenTelemetry.
Resultado: p99 mantenido dentro del SLO; las regresiones se detectan en milisegundos, no en la cola de soporte.
La neocloud que alquila H100 / H200 / Blackwell a sus tenants.
Un cloud de GPU multi-tenant. Cada tenant requiere rutas RoCEv2 lossless aisladas, sin un segmento de fabric independiente por cliente ni una segunda imagen del NOS.
Mecanismos: Aislamiento EVPN-VXLAN + RoCEv2 lossless sobre una única instancia OcNOS-DC.
Resultado: aislamiento por tenant, un único modelo operativo, un único SLA, una única imagen que actualizar.
Traiga su topología. Le mostraremos el camino.
Cada architecture review de IPI lo dirige un network engineer que opera OcNOS en producción: sin diapositivas, sin teatralización comercial. Aporten el número de GPU, la elección de NIC y el JCT objetivo; se traducirá a topología, SKUs y configuraciones disponibles hoy.
Conéctelo a todo lo demás.
La IA es un segmento del data center. DC Fabric y DCI extienden la misma imagen OcNOS a compute, almacenamiento y sedes remotas: mismo NOS, misma CLI, mismo SLA.
La respuesta honesta FAQ.
Fabric IA sin pérdidas basado en Ethernet OcNOS 800G
Formulario breve — su PDF se descargará de inmediato tras el envío.
✓ Su descarga está comenzando…
Si la descarga no se inicia automáticamente, utilice el enlace inferior.
Solution_Brief-OcNOS_800G_Ethernet-Based_Lossless_AI_Fabric.pdfFabric DC EVPN-VXLAN
Formulario breve — su PDF se descargará de inmediato tras el envío.
✓ Su descarga está comenzando…
Si la descarga no se inicia automáticamente, utilice el enlace inferior.
OcNOS-modernize-your-data-center-EVPN-VxLAN_Solution-Brief.pdfAI fabric & DC deployments
Production AI clusters and data-center fabrics running OcNOS-DC on Broadcom Tomahawk 4/5.

NTT DATA partnered with IP Infusion to take disaggregated open networking solutions to market, offering OcNOS-powered Cell Site Routers, Routed…

Scott Data deployed OcNOS with open networking hardware from UfiSpace, Edgecore Networks, and Celestica, replacing legacy vendor stacks across its…

Madeo Consultant, a France-based data center systems integrator, replaced Cisco Nexus and Catalyst switches with IP Infusion OcNOS on Edgecore…

Prosoluce, a French ISP and managed services provider, upgraded its core to a 100G EVPN-VXLAN backbone running IP Infusion OcNOS…
Related from the blog
The AI Network Decision Framework: GPU Fabric for Speed, ROI, Strategic Freedom
Buyer-side framework for GPU fabric decisions with RoCEv2 and open hardware
Read the post →OcNOS 7.0 for Data Centers: AI Fabric, 800G Platforms, EVPN-VXLAN at Scale
800G AI fabric features and Tomahawk 5 platforms shipping in OcNOS 7.0
Read the post →OcNOS 7.0: What’s New for AI, Transport, and Cloud
Highlights RoCEv2 lossless transport with PFC for GPU clusters
Read the post →OcNOS 6.6 for Data Centers: AI Fabric PFC/ETS, EVPN Policy, 400G
PFC/ETS lossless DCB features that underpin OcNOS AI fabric deployments
Read the post →