RoCEv2 · DCQCN · DLB · UEC 1.0

Eine offene AI Fabric: entwickelt für das, was Ihr Trainingsjob tatsächlich erlebt.

Der Engpass beim groß angelegten AI-Training ist das Netzwerk zwischen den GPUs. OcNOS-DC betreibt ein verlustfreies 800G RoCEv2 Fabric auf offenen Ethernet-Switches, heute abgestimmt auf GPU-Collectives und als Nächstes auf Ultra Ethernet: die offene Alternative zu einem geschlossenen Single-Vendor AI-Stack.

600+OcNOS-Netze im Produktivbetrieb
60+Countries in service
26 JahreRouting-Stack im Produktivbetrieb
16kObergrenze des GPU-Referenzdesigns
The stakes

Was die Job-Abschlusszeit beeinflusst

Bei großer Skalierung zählt, wie schnell Jobs abgeschlossen werden und wie ausgelastet die GPUs bleiben, nicht der Switch-Durchsatz. Jedes Mal, wenn der Cluster zur Synchronisation pausiert, verursachen ungenutzte GPUs Kosten, daher darf das Fabric nichts verwerfen und muss im Moment des Entstehens auf Congestion reagieren.

OcNOS-DC legt jede Einstellung offen, sodass Ihr Team es auf realen GPU-Collective-Verkehr (NCCL, RCCL, oneCCL) abstimmen kann. Jedes der folgenden Muster zeigt das Problem, den Mechanismus, der es löst, und den Nutzen, den Sie erhalten.

Trainings-Synchronisation (AllReduce)
Jede GPU kommuniziert gleichzeitig mit jeder anderen GPU
Standard-Load-Balancing bindet diese großen Flows an einen einzigen Uplink, sodass manche Links überlastet sind, während andere ungenutzt bleiben und die Synchronisation auf den langsamsten wartet.
DLB verlagert Flows in unter einer Millisekunde auf weniger ausgelastete Pfade.
GLB (OcNOS 7.1) verteilt die Last über das gesamte Fabric, nicht nur über den lokalen Hop.
Ergebnis: keine Traffic-Hotspots; der Synchronisationsschritt läuft nahezu mit voller Geschwindigkeit.
Traffic-Bursts (Incast)
Viele Sender treffen innerhalb von Mikrosekunden auf einen Port
Geht ein Paket verloren, startet das gesamte Collective neu; pausiert man zu stark, friert der Link ein. In beiden Fällen gerät der Lauf ins Stocken.
DCQCN bremst Sender frühzeitig ab, bevor etwas überläuft.
PFC watchdog löst einen blockierten Port eigenständig.
Ergebnis: Jobs überstehen Bursts, und ein blockierter Port erholt sich ohne manuellen Reset.
Scale-out (Multi-Rail)
Ein Flow benötigt alle parallelen Pfade gleichzeitig
Heute nimmt ein Flow einen einzigen Pfad, während die anderen Rails ungenutzt bleiben.
Ultra Ethernet (UEC 1.0) verteilt einen einzelnen Flow gleichzeitig über alle Pfade.
→ Der Switch, den Sie heute kaufen, bleibt beim Eintreffen von UEC-NICs weiter nutzbar, ohne Austausch.
Ergebnis: die langsamsten Übertragungen beschleunigen sich mit der Einführung von UEC-NICs.
~55 % → 90 %+

Referenz-Benchmark. DLB steigert die Fabric-Auslastung von etwa 55% bei Standard-Load-Balancing auf über 90% auf denselben Switches, ohne zusätzliche Uplinks. (Von der Industrie veröffentlichter Broadcom-Wert, reproduzierbar auf Tomahawk 4 und 5.)

DLB Deep-Dive →
Reference topology

800G Spine-Leaf, verlustfrei von Ende zu Ende

Ein Standard-Leaf-Spine-Design (Clos): ein geroutetes eBGP-Underlay, gleichmäßig über alle Pfade verteilter Datenverkehr, verlustfreie Priority-Queues für GPU-Verkehr und ein separates Management-Netzwerk für Zero-Touch-Provisioning und Telemetrie. Bewegen Sie den Mauszeiger über einen Knoten, um Plattform, Portanzahl und Chip anzuzeigen.

AI-Fabric-Topologie: 800G Spine-Leaf mit parallelen Leaves, Full-Mesh-eBGP, einem isolierten Management-Bus und Leaf-angebundenem Storage
AI Fabric: 800G Spine-Leaf, Full-Mesh-eBGP, ein isolierter Management-Bus und Leaf-angebundener Storage.
The hardware

Validierte offene Switches

OcNOS-DC läuft auf Broadcom Tomahawk und Trident Switches von Edgecore und UfiSpace, sodass jede Plattform validiert, bestellbar und aus zweiter Quelle beziehbar ist.

Edgecore AIS800-64D 800G spine switch
Spine · Tomahawk 5

Edgecore AIS800-64D

64 x 800G · 51.2 Tbps

QSFP-DD800 · breakout to 2x400G / 4x200G / 8x100G

Datasheet →
UfiSpace S9321-64E 800G spine switch
Spine · Tomahawk 5

UfiSpace S9321-64E

64 x 800G · 51.2 Tbps

QSFP-DD800 · breakout to 2x400G / 4x200G / 8x100G

Datasheet →
Edgecore AS9736-64D 400G leaf switch
Leaf · Tomahawk 4

Edgecore AS9736-64D

64 x 400G · 25.6 Tbps · deep buffer

QSFP56-DD 400G · breakout to 4x100G / 4x25G · DAC / AOC

Datasheet →

Alle 40+ validierten Plattformen in der HCL ansehen →

Ein Anbieter für Software, Hardware und Support

SUPPORT AUS EINER HAND

Ein Vertrag, ein Ansprechpartner

Ein einziger IP Infusion Vertrag deckt die OcNOS-DC Software und die validierte Switch-Hardware gemeinsam ab, sodass es einen TAC und einen SLA gibt statt eines getrennten NOS- und Hardware-Anbieters. Ein 24/7 Support-Portal ist in den Tarifen Premium und Enterprise verfügbar.

Support-Details ansehen
IP MAESTRO MANAGEMENT

Eine Konsole für das Fabric

IP Maestro ist ein Element-Management-System für OcNOS: Topologie, Störungen, Konfiguration und Software-Images über alle Switches hinweg per NETCONF, angesiedelt unterhalb Ihres bestehenden OSS. Validiert für 250 Geräte pro Instanz.

IP Maestro erkunden
AUTOMATED DAY 2

Streaming-Telemetrie und Zero-Touch

gNMI-Streaming-Telemetrie speist Prometheus und Grafana, DCBX überträgt automatisch die korrekten verlustfreien Einstellungen an jeden Server, und Zero-Touch-Provisioning bringt Switches bereits beim Booten konfiguriert in Betrieb.

Automatisierung entdecken
Die AI-Fabric-Landschaft 2026

Wo OcNOS-DC steht

Die meisten Optionen bieten heute dieselben Kernfunktionen: verlustfreies RoCEv2, Congestion Control, adaptives Routing, Ultra-Ethernet-Ausrichtung. Was wirklich unterscheidet, ist die Ausgestaltung des Vertrags: ein offenes Betriebssystem oder ein geschlossener Stack, offene oder geschlossene Hardware, Standard-Ethernet oder geschlossenes InfiniBand.

Lösungs-Shape Beispiele Trade-off
Open NOS, AI-hardened, UEC-konform OcNOS-DC auf Edgecore / UfiSpace Dasselbe Broadcom-Silizium, dieselbe technische Basis. xCCL-optimiertes DCQCN, DLB im Sub-Millisekunden-Bereich, GLB auf der 7.1 Roadmap, PFC-Deadlock-Watchdog, UEC 1.0 Fabric-Profil. Single-Vendor-Support. Kein NIC-, GPU- oder Hardware-Lock-in.
Geschlossener vertikaler AI-Stack NVIDIA Spectrum-X + Quantum + ConnectX Hervorragende integrierte Performance. NIC, Switch und Fabric-Software an einen einzelnen Anbieter gebunden, und an dessen GPU-Roadmap.
Geschlossenes Merchant-Silicon-NOS Arista EOS · Cisco NX-OS · Juniper Junos Darunter dasselbe Broadcom-Silizium. Aufpreis je Port-Lizenz. Telemetrie und Tuning auf die Pipeline des jeweiligen Anbieters beschränkt.
Zellbasierte proprietäre Chassis-Fabric DriveNets Network Cloud Andere Architektur: Scheduled Cell Fabric, kein Ethernet-NOS. Stark im Hyperscale-Bereich; nicht auf Standard-Switches übertragbar.
Closed-Loop-InfiniBand NVIDIA Quantum InfiniBand Heute niedrigste Latenz für eng gekoppelte Collectives. Separate Verkabelung, separater Betrieb, Single-Vendor-Ökosystem. UEC schließt die Lücke bei Ethernet.
Open NOS, ohne AI-Hardening Community SONiC Open Hardware, kostenfreie Software, ohne SLA. Für xCCL-optimierte Standardwerte, Deadlock-Watchdog und Tuning-Reife ist allein der Betreiber verantwortlich.

Jede Option zielt auf eine andere Priorität ab. OcNOS-DC überzeugt mit offener Hardware, einer Komplettlösung und ohne Lock-in.

AI Fabric Dimensionierungsleitfaden

Dimensionieren Sie Ihr GPU-Fabric in wenigen Minuten

Geben Sie Ihre GPU-Anzahl und NIC-Geschwindigkeit ein. Die AI Fabric Design Suite bildet daraus eine Leaf-Spine-Topologie, Switch- und Portanzahlen sowie eine Stückliste ab, die Sie direkt für ein Angebot verwenden können. Keine Tabellenkalkulation erforderlich.

Häufige Fragen

Häufig gestellte Fragen

Ist OcNOS-DC wirklich "AI-native", oder einfach nur RoCEv2 mit Zusätzen?
Kein NOS auf Merchant Silicon ist im Wortsinn AI-native: keines verarbeitet xCCL-Kollektive (NCCL / RCCL / oneCCL) oder plant Jobs auf dem Switch; das liegt in der NIC und im Scheduler. OcNOS-DC implementiert jeden Fabric-Mechanismus, den ein KI-Workload 2026 benötigt: verlustfreies RoCEv2, DCQCN mit xCCL-qualifizierten Voreinstellungen, Sub-ms-DLB, GLB (OcNOS 7.1), PFC-Deadlock-Watchdog, UEC-1.0-Ausrichtung: und hält sich aus den darüberliegenden Schichten heraus. „AI-aware Fabric“ bedeutet in der Regel lediglich, dass ein einzelner Anbieter NIC + Switch + Scheduler als eine geschlossene SKU verkauft.
Wo endet OcNOS-DC und wo übernehmen NIC und Cluster-Scheduler?
OcNOS-DC verantwortet Layer 1: verlustfreien RDMA-Transport, Congestion Control, Adaptive Routing, Deadlock-Recovery, Telemetrie. Die NIC verantwortet Layer 2 (xCCL, RDMA-Verbs, Packet Spray, GPU-Direct Memory); der Scheduler verantwortet Layer 3 (Job Placement, Gradient-Sync-Fenster, Mandantentrennung). OcNOS-DC streamt gNMI-Telemetrie in Layer 3, beansprucht aber nie die Rolle des Schedulers: diese Trennung hält NIC, GPU und Orchestrierung austauschbar.
Wie schneidet OcNOS AI Fabric im Vergleich zu NVIDIA Spectrum-X, SONiC, Arista, Cisco oder DriveNets ab?
Spectrum-X ist ein geschlossener Stack aus NVIDIA-NIC, -Switch und -Software: hervorragende Performance, Single-Vendor-Lock-in. Arista, Cisco und Juniper bieten vergleichbare RoCEv2-Funktionen auf proprietärer Hardware mit proprietärer Lizenzierung. Community-SONiC ist offen, liefert jedoch keine KI-gehärteten Voreinstellungen, keinen Watchdog und kein SLA. DriveNets DDC ist eine proprietäre Cell-Fabric, kein Ethernet-NOS. OcNOS-DC: offenes NOS auf demselben Broadcom-Silizium, UEC-konform, xCCL-abgestimmtes DCQCN, 24/7-SLA: dieselbe technische Basis, kein Lock-in.
Was bedeutet Ultra Ethernet (UEC) 1.0 für OcNOS AI Fabric?
UEC 1.0 bringt Packet-Spray, Multi-Path-RDMA und Out-of-Order-Delivery ins Ethernet: die offene Antwort auf InfiniBand. Produktiv-Fabrics betreiben heute RoCEv2 + DCQCN + DLB, alles vollständig unterstützt; UEC parallelisiert jeden Flow über mehrere Pfade, statt ihn an einen einzelnen ECMP-Hash zu binden. OcNOS-DC verfolgt das UEC 1.0-Fabric-Profil, sodass der Switch, den Sie heute kaufen, ohne NOS- oder Hardware-Wechsel auf UEC-NICs übergeht. Siehe den Ultra Ethernet Deep-Dive.
Was ist RoCEv2 und warum erfordert es ein verlustfreies Ethernet-Fabric?
RoCEv2 ermöglicht direkte GPU-zu-GPU-Speicherübertragungen ohne CPU-Overhead für Kollektive wie AllReduce und AllGather. RDMA kennt keine Neuübertragung: ein verworfenes Paket startet die Operation auf jeder GPU neu: daher ist eine verlustfreie Fabric (PFC + ECN) im Produktivbetrieb zwingend erforderlich. OcNOS-DC liefert RoCEv2-Buffer-Profile und DCQCN-Voreinstellungen, die auf xCCL-Kollektivmuster abgestimmt sind.
Wie stellt OcNOS-DC verlustfreien Betrieb sicher, und was schützt vor PFC-Deadlock?
Drei Mechanismen: PFC pausiert Datenverkehr je Priorität, bevor Puffer überlaufen; ECN markiert Pakete frühzeitig, um Sender zu drosseln; ETS hält RDMA-Flows vor niedriger priorisiertem Verkehr. Darüber liegt ein Deadlock-Watchdog je Port und je Priorität, der Zyklen pausierter Queues erkennt und die Queue automatisch leert, bevor Jobs hängen: bislang der Fehlerfall, der mitten im Lauf einen Power-Cycle des Switches erzwang. PFC over L3 wird über geroutete Grenzen hinweg unterstützt.
Was ist DLB, und was ändert sich mit GLB in OcNOS 7.1?
Standard-ECMP bindet einen Flow für seine gesamte Lebensdauer an einen Uplink und führt während AllReduce zu Elephant-Flow-Kollisionen. DLB nutzt Live-Telemetrie der ASIC-Queue-Tiefe, um Flowlets im Sub-Millisekundenbereich auf weniger belastete Pfade umzubinden, und schließt damit die Lücke am lokalen Hop. GLB (OcNOS 7.1) erweitert dies Ende-zu-Ende: Spines spielen Pfadqualitäts-Telemetrie an die Ingress-Leaves zurück, sodass das Routing die volle Multi-Hop-Bewertung berücksichtigt und sich sauber bis auf Cluster mit 16k GPUs skalieren lässt.
Welche Skalierung unterstützt OcNOS AI Fabric, und welche Referenzdesigns sind qualifiziert?
OcNOS-DC unterstützt 400G- und 800G-Leaf-Spine-Fabrics. Tomahawk 5-Spines (Edgecore AIS800-64D, UfiSpace S9321-64E) liefern 51,2 Tbps / 64 × 800G; Tomahawk 4-Leaves laufen mit 400G / 25,6 Tbps und Deep-HBM-Buffer; Trident 4 deckt kleinere 100G/400G-Fabrics ab. Die Referenzdesigns umfassen Rail-Only-, Rail-Optimized- und 3-stufige Clos-Topologien bis zu 16k GPU: siehe den AI Fabric Topologies Deep-Dive.
Unterstützt OcNOS-DC Automatisierung und Telemetrie für den Betrieb von AI Fabrics?
Ja. DCBX automatisiert die RoCEv2-Konfiguration zwischen Server und Switch, ZTP (IPv4/IPv6) übernimmt das Zero-Touch-Onboarding, und gNMI streamt On-Change-Telemetrie über OpenConfig YANG. PFC-Pausen, ECN-Marking, DCQCN-Schwellenwerte und Puffertiefen sind gNMI-Sensorpfade, die von Prometheus, InfluxDB, Telegraf, Grafana oder jeder OpenTelemetry-Pipeline genutzt werden können. Ansible-Playbooks und ein Terraform-Provider decken Day-0 bis Day-2 ab. IP Maestro, ein Element-Management-System für OcNOS, verwaltet Topologie, Störungen, Konfiguration und Software-Images von einer Konsole aus über NETCONF und ist für 250 Geräte pro Instanz validiert.
Welche Switch-Hardware und 800G-Optiken unterstützt das OcNOS AI Fabric?
Die Fabric basiert auf validierten Broadcom Tomahawk 4 und 5 Switches von Edgecore und UfiSpace. Die 800G Spines (Edgecore AIS800-64D und UfiSpace S9321-64E, Tomahawk 5, 64 x 800G QSFP-DD800, 51.2 Tbps) lassen sich auf 400G, 200G und 100G aufteilen; der 400G Leaf (Edgecore AS9736-64D, Tomahawk 4, 64 x 400G QSFP56-DD, 25.6 Tbps mit Deep Buffer) lässt sich auf 100G und 25G aufteilen. Die Optiken stammen von mehreren Anbietern und werden pro Deployment qualifiziert. Kontaktieren Sie uns daher für die validierte Transceiver-Liste für Ihren Aufbau. Die Switch-Plattformen sind in der HCL aufgeführt.
Wer bietet Support für das AI Fabric, und ist die Hardware ebenfalls abgedeckt?
Ein IP Infusion Vertrag deckt die OcNOS-DC Software und die validierte Switch-Hardware gemeinsam ab, sodass es einen TAC und einen SLA gibt. Der Support ist gestaffelt: Standard umfasst E-Mail-TAC, Telefonsupport zu Geschäftszeiten und Hardware-RMA-Koordination mit einer P1-Reaktionszeit von 8 Stunden; Premium ergänzt ein 24/7 Kundensupport-Portal und eine P1-Reaktionszeit von 2 Stunden; Enterprise ergänzt eine P1-Reaktionszeit von 30 Minuten sowie einen Customer Success Manager. Das 24/7 Portal ist in Premium und Enterprise verfügbar.