RoCEv2 · DCQCN · DLB · UEC 1.0

Eine offene AI Fabric: entwickelt für das, was Ihr Trainingsjob tatsächlich erlebt.

Der Engpass beim groß angelegten AI-Training ist das Netzwerk zwischen den GPUs. OcNOS-DC betreibt ein verlustfreies 800G RoCEv2 Fabric auf offenen Ethernet-Switches, heute abgestimmt auf GPU-Collectives und als Nächstes auf Ultra Ethernet: die offene Alternative zu einem geschlossenen Single-Vendor AI-Stack.

Architektur-Review vereinbaren Eine GPU-Fabric dimensionieren

600+OcNOS-Netze im Produktivbetrieb

60+Countries in service

26 JahreRouting-Stack im Produktivbetrieb

16kObergrenze des GPU-Referenzdesigns

Architecture Briefs

Architektur-Briefs herunterladen

Drei kurze Downloads, die tiefer gehen als diese Seite: die verlustfreie AI-Fabric-Architektur, die EVPN-VXLAN Data Center Referenz und DCI der nächsten Generation mit IPoDWDM.

Solution Brief

OcNOS 800G Ethernet-basierte verlustfreie AI Fabric

Non-Blocking-RoCEv2-Fabric auf Tomahawk-4/5-Spines: SKU-Stufen, qualifizierte Plattformen und Deployment-Architektur.

Brief anfordern

Solution Brief

EVPN-VXLAN Data Center Fabric

Carrier-Grade-Leaf-Spine-Data-Center-Fabric: symmetrisches IRB, Type-2/Type-5-Routen, verteiltes Anycast-Gateway.

Brief anfordern

Solution Brief

DCI der nächsten Generation mit IPoDWDM

Reduzieren Sie die Transponder-Ebene: Betreiben Sie kohärente 400G/800G ZR und ZR+ Optiken direkt vom Router aus für den Data Center Interconnect.

Brief anfordern

The stakes

Was die Job-Abschlusszeit beeinflusst

Bei großer Skalierung zählt, wie schnell Jobs abgeschlossen werden und wie ausgelastet die GPUs bleiben, nicht der Switch-Durchsatz. Jedes Mal, wenn der Cluster zur Synchronisation pausiert, verursachen ungenutzte GPUs Kosten, daher darf das Fabric nichts verwerfen und muss im Moment des Entstehens auf Congestion reagieren.

OcNOS-DC legt jede Einstellung offen, sodass Ihr Team es auf realen GPU-Collective-Verkehr (NCCL, RCCL, oneCCL) abstimmen kann. Jedes der folgenden Muster zeigt das Problem, den Mechanismus, der es löst, und den Nutzen, den Sie erhalten.

Trainings-Synchronisation (AllReduce)

Jede GPU kommuniziert gleichzeitig mit jeder anderen GPU

Standard-Load-Balancing bindet diese großen Flows an einen einzigen Uplink, sodass manche Links überlastet sind, während andere ungenutzt bleiben und die Synchronisation auf den langsamsten wartet.
→ DLB verlagert Flows in unter einer Millisekunde auf weniger ausgelastete Pfade.
→ GLB (OcNOS 7.1) verteilt die Last über das gesamte Fabric, nicht nur über den lokalen Hop.

Ergebnis: keine Traffic-Hotspots; der Synchronisationsschritt läuft nahezu mit voller Geschwindigkeit.

Traffic-Bursts (Incast)

Viele Sender treffen innerhalb von Mikrosekunden auf einen Port

Geht ein Paket verloren, startet das gesamte Collective neu; pausiert man zu stark, friert der Link ein. In beiden Fällen gerät der Lauf ins Stocken.
→ DCQCN bremst Sender frühzeitig ab, bevor etwas überläuft.
→ PFC watchdog löst einen blockierten Port eigenständig.

Ergebnis: Jobs überstehen Bursts, und ein blockierter Port erholt sich ohne manuellen Reset.

Scale-out (Multi-Rail)

Ein Flow benötigt alle parallelen Pfade gleichzeitig

Heute nimmt ein Flow einen einzigen Pfad, während die anderen Rails ungenutzt bleiben.
→ Ultra Ethernet (UEC 1.0) verteilt einen einzelnen Flow gleichzeitig über alle Pfade.
→ Der Switch, den Sie heute kaufen, bleibt beim Eintreffen von UEC-NICs weiter nutzbar, ohne Austausch.

Ergebnis: die langsamsten Übertragungen beschleunigen sich mit der Einführung von UEC-NICs.

~55 % → 90 %+

Referenz-Benchmark. DLB steigert die Fabric-Auslastung von etwa 55% bei Standard-Load-Balancing auf über 90% auf denselben Switches, ohne zusätzliche Uplinks. (Von der Industrie veröffentlichter Broadcom-Wert, reproduzierbar auf Tomahawk 4 und 5.)

DLB Deep-Dive →

Reference topology

800G Spine-Leaf, verlustfrei von Ende zu Ende

Ein Standard-Leaf-Spine-Design (Clos): ein geroutetes eBGP-Underlay, gleichmäßig über alle Pfade verteilter Datenverkehr, verlustfreie Priority-Queues für GPU-Verkehr und ein separates Management-Netzwerk für Zero-Touch-Provisioning und Telemetrie. Bewegen Sie den Mauszeiger über einen Knoten, um Plattform, Portanzahl und Chip anzuzeigen.

AI-Fabric-Topologie: 800G Spine-Leaf mit parallelen Leaves, Full-Mesh-eBGP, einem isolierten Management-Bus und Leaf-angebundenem Storage — AI Fabric: 800G Spine-Leaf, Full-Mesh-eBGP, ein isolierter Management-Bus und Leaf-angebundener Storage.

The hardware

Validierte offene Switches

OcNOS-DC läuft auf Broadcom Tomahawk und Trident Switches von Edgecore und UfiSpace, sodass jede Plattform validiert, bestellbar und aus zweiter Quelle beziehbar ist.

Spine · Tomahawk 5

Edgecore AIS800-64D

64 x 800G · 51.2 Tbps

QSFP-DD800 · breakout to 2x400G / 4x200G / 8x100G

Datasheet →

Spine · Tomahawk 5

UfiSpace S9321-64E

64 x 800G · 51.2 Tbps

QSFP-DD800 · breakout to 2x400G / 4x200G / 8x100G

Datasheet →

Leaf · Tomahawk 4

Edgecore AS9736-64D

64 x 400G · 25.6 Tbps · deep buffer

QSFP56-DD 400G · breakout to 4x100G / 4x25G · DAC / AOC

Datasheet →

Alle 40+ validierten Plattformen in der HCL ansehen →

Ein Anbieter für Software, Hardware und Support

SUPPORT AUS EINER HAND

Ein Vertrag, ein Ansprechpartner

Ein einziger IP Infusion Vertrag deckt die OcNOS-DC Software und die validierte Switch-Hardware gemeinsam ab, sodass es einen TAC und einen SLA gibt statt eines getrennten NOS- und Hardware-Anbieters. Ein 24/7 Support-Portal ist in den Tarifen Premium und Enterprise verfügbar.

Support-Details ansehen

IP MAESTRO MANAGEMENT

Eine Konsole für das Fabric

IP Maestro ist ein Element-Management-System für OcNOS: Topologie, Störungen, Konfiguration und Software-Images über alle Switches hinweg per NETCONF, angesiedelt unterhalb Ihres bestehenden OSS. Validiert für 250 Geräte pro Instanz.

IP Maestro erkunden

AUTOMATED DAY 2

Streaming-Telemetrie und Zero-Touch

gNMI-Streaming-Telemetrie speist Prometheus und Grafana, DCBX überträgt automatisch die korrekten verlustfreien Einstellungen an jeden Server, und Zero-Touch-Provisioning bringt Switches bereits beim Booten konfiguriert in Betrieb.

Automatisierung entdecken

Die AI-Fabric-Landschaft 2026

Wo OcNOS-DC steht

Die meisten Optionen bieten heute dieselben Kernfunktionen: verlustfreies RoCEv2, Congestion Control, adaptives Routing, Ultra-Ethernet-Ausrichtung. Was wirklich unterscheidet, ist die Ausgestaltung des Vertrags: ein offenes Betriebssystem oder ein geschlossener Stack, offene oder geschlossene Hardware, Standard-Ethernet oder geschlossenes InfiniBand.

Lösungs-Shape Beispiele Trade-off

Open NOS, AI-hardened, UEC-konform OcNOS-DC auf Edgecore / UfiSpace Dasselbe Broadcom-Silizium, dieselbe technische Basis. xCCL-optimiertes DCQCN, DLB im Sub-Millisekunden-Bereich, GLB auf der 7.1 Roadmap, PFC-Deadlock-Watchdog, UEC 1.0 Fabric-Profil. Single-Vendor-Support. Kein NIC-, GPU- oder Hardware-Lock-in.

Geschlossener vertikaler AI-Stack NVIDIA Spectrum-X + Quantum + ConnectX Hervorragende integrierte Performance. NIC, Switch und Fabric-Software an einen einzelnen Anbieter gebunden, und an dessen GPU-Roadmap.

Geschlossenes Merchant-Silicon-NOS Arista EOS · Cisco NX-OS · Juniper Junos Darunter dasselbe Broadcom-Silizium. Aufpreis je Port-Lizenz. Telemetrie und Tuning auf die Pipeline des jeweiligen Anbieters beschränkt.

Zellbasierte proprietäre Chassis-Fabric DriveNets Network Cloud Andere Architektur: Scheduled Cell Fabric, kein Ethernet-NOS. Stark im Hyperscale-Bereich; nicht auf Standard-Switches übertragbar.

Closed-Loop-InfiniBand NVIDIA Quantum InfiniBand Heute niedrigste Latenz für eng gekoppelte Collectives. Separate Verkabelung, separater Betrieb, Single-Vendor-Ökosystem. UEC schließt die Lücke bei Ethernet.

Open NOS, ohne AI-Hardening Community SONiC Open Hardware, kostenfreie Software, ohne SLA. Für xCCL-optimierte Standardwerte, Deadlock-Watchdog und Tuning-Reife ist allein der Betreiber verantwortlich.

Jede Option zielt auf eine andere Priorität ab. OcNOS-DC überzeugt mit offener Hardware, einer Komplettlösung und ohne Lock-in.

AI Fabric Dimensionierungsleitfaden

Dimensionieren Sie Ihr GPU-Fabric in wenigen Minuten

Geben Sie Ihre GPU-Anzahl und NIC-Geschwindigkeit ein. Die AI Fabric Design Suite bildet daraus eine Leaf-Spine-Topologie, Switch- und Portanzahlen sowie eine Stückliste ab, die Sie direkt für ein Angebot verwenden können. Keine Tabellenkalkulation erforderlich.

AI Fabric Dimensionierungsleitfaden öffnen Architektur-Review vereinbaren

OcNOS über das gesamte Rechenzentrum erweitern

AI ist ein Segment des Rechenzentrums. Dasselbe OcNOS-Image erstreckt sich auf Compute, Storage und entfernte Standorte: dasselbe NOS, dieselbe CLI, derselbe Support.

Häufige Fragen

Häufig gestellte Fragen

Ist OcNOS-DC wirklich "AI-native", oder einfach nur RoCEv2 mit Zusätzen?

Kein NOS auf Merchant Silicon ist im Wortsinn AI-native: keines verarbeitet xCCL-Kollektive (NCCL / RCCL / oneCCL) oder plant Jobs auf dem Switch; das liegt in der NIC und im Scheduler. OcNOS-DC implementiert jeden Fabric-Mechanismus, den ein KI-Workload 2026 benötigt: verlustfreies RoCEv2, DCQCN mit xCCL-qualifizierten Voreinstellungen, Sub-ms-DLB, GLB (OcNOS 7.1), PFC-Deadlock-Watchdog, UEC-1.0-Ausrichtung: und hält sich aus den darüberliegenden Schichten heraus. „AI-aware Fabric“ bedeutet in der Regel lediglich, dass ein einzelner Anbieter NIC + Switch + Scheduler als eine geschlossene SKU verkauft.

Wo endet OcNOS-DC und wo übernehmen NIC und Cluster-Scheduler?

OcNOS-DC verantwortet Layer 1: verlustfreien RDMA-Transport, Congestion Control, Adaptive Routing, Deadlock-Recovery, Telemetrie. Die NIC verantwortet Layer 2 (xCCL, RDMA-Verbs, Packet Spray, GPU-Direct Memory); der Scheduler verantwortet Layer 3 (Job Placement, Gradient-Sync-Fenster, Mandantentrennung). OcNOS-DC streamt gNMI-Telemetrie in Layer 3, beansprucht aber nie die Rolle des Schedulers: diese Trennung hält NIC, GPU und Orchestrierung austauschbar.

Wie schneidet OcNOS AI Fabric im Vergleich zu NVIDIA Spectrum-X, SONiC, Arista, Cisco oder DriveNets ab?

Spectrum-X ist ein geschlossener Stack aus NVIDIA-NIC, -Switch und -Software: hervorragende Performance, Single-Vendor-Lock-in. Arista, Cisco und Juniper bieten vergleichbare RoCEv2-Funktionen auf proprietärer Hardware mit proprietärer Lizenzierung. Community-SONiC ist offen, liefert jedoch keine KI-gehärteten Voreinstellungen, keinen Watchdog und kein SLA. DriveNets DDC ist eine proprietäre Cell-Fabric, kein Ethernet-NOS. OcNOS-DC: offenes NOS auf demselben Broadcom-Silizium, UEC-konform, xCCL-abgestimmtes DCQCN, 24/7-SLA: dieselbe technische Basis, kein Lock-in.

Was bedeutet Ultra Ethernet (UEC) 1.0 für OcNOS AI Fabric?

UEC 1.0 bringt Packet-Spray, Multi-Path-RDMA und Out-of-Order-Delivery ins Ethernet: die offene Antwort auf InfiniBand. Produktiv-Fabrics betreiben heute RoCEv2 + DCQCN + DLB, alles vollständig unterstützt; UEC parallelisiert jeden Flow über mehrere Pfade, statt ihn an einen einzelnen ECMP-Hash zu binden. OcNOS-DC verfolgt das UEC 1.0-Fabric-Profil, sodass der Switch, den Sie heute kaufen, ohne NOS- oder Hardware-Wechsel auf UEC-NICs übergeht. Siehe den Ultra Ethernet Deep-Dive.

Was ist RoCEv2 und warum erfordert es ein verlustfreies Ethernet-Fabric?

RoCEv2 ermöglicht direkte GPU-zu-GPU-Speicherübertragungen ohne CPU-Overhead für Kollektive wie AllReduce und AllGather. RDMA kennt keine Neuübertragung: ein verworfenes Paket startet die Operation auf jeder GPU neu: daher ist eine verlustfreie Fabric (PFC + ECN) im Produktivbetrieb zwingend erforderlich. OcNOS-DC liefert RoCEv2-Buffer-Profile und DCQCN-Voreinstellungen, die auf xCCL-Kollektivmuster abgestimmt sind.

Wie stellt OcNOS-DC verlustfreien Betrieb sicher, und was schützt vor PFC-Deadlock?

Drei Mechanismen: PFC pausiert Datenverkehr je Priorität, bevor Puffer überlaufen; ECN markiert Pakete frühzeitig, um Sender zu drosseln; ETS hält RDMA-Flows vor niedriger priorisiertem Verkehr. Darüber liegt ein Deadlock-Watchdog je Port und je Priorität, der Zyklen pausierter Queues erkennt und die Queue automatisch leert, bevor Jobs hängen: bislang der Fehlerfall, der mitten im Lauf einen Power-Cycle des Switches erzwang. PFC over L3 wird über geroutete Grenzen hinweg unterstützt.

Was ist DLB, und was ändert sich mit GLB in OcNOS 7.1?

Standard-ECMP bindet einen Flow für seine gesamte Lebensdauer an einen Uplink und führt während AllReduce zu Elephant-Flow-Kollisionen. DLB nutzt Live-Telemetrie der ASIC-Queue-Tiefe, um Flowlets im Sub-Millisekundenbereich auf weniger belastete Pfade umzubinden, und schließt damit die Lücke am lokalen Hop. GLB (OcNOS 7.1) erweitert dies Ende-zu-Ende: Spines spielen Pfadqualitäts-Telemetrie an die Ingress-Leaves zurück, sodass das Routing die volle Multi-Hop-Bewertung berücksichtigt und sich sauber bis auf Cluster mit 16k GPUs skalieren lässt.

Welche Skalierung unterstützt OcNOS AI Fabric, und welche Referenzdesigns sind qualifiziert?

OcNOS-DC unterstützt 400G- und 800G-Leaf-Spine-Fabrics. Tomahawk 5-Spines (Edgecore AIS800-64D, UfiSpace S9321-64E) liefern 51,2 Tbps / 64 × 800G; Tomahawk 4-Leaves laufen mit 400G / 25,6 Tbps und Deep-HBM-Buffer; Trident 4 deckt kleinere 100G/400G-Fabrics ab. Die Referenzdesigns umfassen Rail-Only-, Rail-Optimized- und 3-stufige Clos-Topologien bis zu 16k GPU: siehe den AI Fabric Topologies Deep-Dive.

Unterstützt OcNOS-DC Automatisierung und Telemetrie für den Betrieb von AI Fabrics?

Ja. DCBX automatisiert die RoCEv2-Konfiguration zwischen Server und Switch, ZTP (IPv4/IPv6) übernimmt das Zero-Touch-Onboarding, und gNMI streamt On-Change-Telemetrie über OpenConfig YANG. PFC-Pausen, ECN-Marking, DCQCN-Schwellenwerte und Puffertiefen sind gNMI-Sensorpfade, die von Prometheus, InfluxDB, Telegraf, Grafana oder jeder OpenTelemetry-Pipeline genutzt werden können. Ansible-Playbooks und ein Terraform-Provider decken Day-0 bis Day-2 ab. IP Maestro, ein Element-Management-System für OcNOS, verwaltet Topologie, Störungen, Konfiguration und Software-Images von einer Konsole aus über NETCONF und ist für 250 Geräte pro Instanz validiert.

Welche Switch-Hardware und 800G-Optiken unterstützt das OcNOS AI Fabric?

Die Fabric basiert auf validierten Broadcom Tomahawk 4 und 5 Switches von Edgecore und UfiSpace. Die 800G Spines (Edgecore AIS800-64D und UfiSpace S9321-64E, Tomahawk 5, 64 x 800G QSFP-DD800, 51.2 Tbps) lassen sich auf 400G, 200G und 100G aufteilen; der 400G Leaf (Edgecore AS9736-64D, Tomahawk 4, 64 x 400G QSFP56-DD, 25.6 Tbps mit Deep Buffer) lässt sich auf 100G und 25G aufteilen. Die Optiken stammen von mehreren Anbietern und werden pro Deployment qualifiziert. Kontaktieren Sie uns daher für die validierte Transceiver-Liste für Ihren Aufbau. Die Switch-Plattformen sind in der HCL aufgeführt.

Wer bietet Support für das AI Fabric, und ist die Hardware ebenfalls abgedeckt?

Ein IP Infusion Vertrag deckt die OcNOS-DC Software und die validierte Switch-Hardware gemeinsam ab, sodass es einen TAC und einen SLA gibt. Der Support ist gestaffelt: Standard umfasst E-Mail-TAC, Telefonsupport zu Geschäftszeiten und Hardware-RMA-Koordination mit einer P1-Reaktionszeit von 8 Stunden; Premium ergänzt ein 24/7 Kundensupport-Portal und eine P1-Reaktionszeit von 2 Stunden; Enterprise ergänzt eine P1-Reaktionszeit von 30 Minuten sowie einen Customer Success Manager. Das 24/7 Portal ist in Premium und Enterprise verfügbar.

Detailanalysen pro Mechanismus

RoCEv2 + PFC / ECN DCQCN DLB GLB (OcNOS 7.1) PFC Deadlock Watchdog Ultra Ethernet (UEC) AI-Fabric-Topologien InfiniBand vs. Ethernet gNMI-Telemetrie

AI-Fabric- & DC-Deployments

Produktive AI-Cluster und Data-Center-Fabrics, die OcNOS-DC auf Broadcom Tomahawk 4/5 betreiben.

NTT

APAC

NTT DATA ist eine Partnerschaft mit IP Infusion eingegangen, um disaggregierte Open-Networking-Lösungen auf den Markt zu bringen, und bietet OcNOS-basierte Cell Site Router, Routed…

Story lesen →

Scott Data

Amerika

Scott Data hat OcNOS mit Open-Networking-Hardware von UfiSpace, Edgecore Networks und Celestica implementiert und damit Legacy-Vendor-Stacks in seinem gesamten…

Story lesen →

Madeo

EMEAI

Madeo Consultant, ein in Frankreich ansässiger Rechenzentrums-Systemintegrator, hat Cisco Nexus- und Catalyst-Switches durch IP Infusion OcNOS auf Edgecore… ersetzt

Story lesen →

Prosoluce

EMEAI

Prosoluce, ein französischer ISP und Anbieter von Managed Services, rüstete seinen Core auf ein 100G-EVPN-VXLAN-Backbone mit IP Infusion OcNOS auf…

Story lesen →

Alle Kundenbereitstellungen durchsuchen →

Aus dem Blog

Passend aus dem Blog

Aug 2025

Alle Blog-Beiträge →

Lösungen

Produkte

Partner

Ressourcen

Unternehmen

Eine offene AI Fabric: entwickelt für das, was Ihr Trainingsjob tatsächlich erlebt.

Architektur-Briefs herunterladen

OcNOS 800G Ethernet-basierte verlustfreie AI Fabric

EVPN-VXLAN Data Center Fabric

DCI der nächsten Generation mit IPoDWDM

Was die Job-Abschlusszeit beeinflusst

800G Spine-Leaf, verlustfrei von Ende zu Ende

Validierte offene Switches

Edgecore AIS800-64D

UfiSpace S9321-64E

Edgecore AS9736-64D

Ein Anbieter für Software, Hardware und Support

Ein Vertrag, ein Ansprechpartner

Eine Konsole für das Fabric

Streaming-Telemetrie und Zero-Touch

Wo OcNOS-DC steht

Dimensionieren Sie Ihr GPU-Fabric in wenigen Minuten

OcNOS über das gesamte Rechenzentrum erweitern

DC Fabric

IPoDWDM & DCI

Produkt OcNOS-DC

Häufig gestellte Fragen

AI-Fabric- & DC-Deployments

Passend aus dem Blog

Das AI Network Decision Framework: GPU-Fabric für Geschwindigkeit, ROI, strategische Freiheit

OcNOS 7.0 für Rechenzentren: AI Fabric, 800G-Plattformen, EVPN-VXLAN im großen Maßstab

OcNOS 7.0: What's New for AI, Transport, and Cloud

OcNOS 6.6 für Rechenzentren: AI Fabric PFC/ETS, EVPN Policy, 400G