Eine offene AI Fabric: entwickelt für das, was Ihr Trainingsjob tatsächlich erlebt.
Bei tausenden Beschleunigern misst man Switches nicht in Tbps, gemessen wird Job Completion Time, GPU-Auslastung und Tail-Latenz unter Microbursts. OcNOS-DC erreicht diese Werte auf offenem Merchant Silicon mit einem 24/7-Carrier-Grade-SLA: dieselbe technische Basis wie geschlossene KI-Stacks, ohne deren Lock-in.
Offline mitnehmen. Lesen Sie es im Flugzeug.
Zwei kompakte Downloads, die diese Seite vertiefen: die verlustfreie AI-Fabric-Architektur und die EVPN-VXLAN-Data-Center-Referenz.
OcNOS 800G Ethernet-basierte verlustfreie AI Fabric
Non-Blocking-RoCEv2-Fabric auf Tomahawk-4/5-Spines: SKU-Stufen, qualifizierte Plattformen und Deployment-Architektur.
Brief anfordernEVPN-VXLAN Data Center Fabric
Carrier-Grade-Leaf-Spine-Data-Center-Fabric: symmetrisches IRB, Type-2/Type-5-Routen, verteiltes Anycast-Gateway.
Brief anfordern„Wird mein Training-Job wirklich schneller fertig?"
Im großen Maßstab verlieren klassische Netzwerkmetriken an Aussagekraft. Was zählt, ist Job Completion Time, GPU-Auslastung und Tail-Latenz unter Microbursts, denn jede Minute, in der ein milliardenschwerer Cluster auf einen Synchronisationsschritt wartet, ist verbranntes Kapital.
Die verlustfreie Low-Latency-Performance, die KI-Workloads benötigen, setzt keinen geschlossenen proprietären Stack mehr voraus. Auf offenem Merchant Silicon mit Carrier-Grade-SLA erreicht OcNOS-DC dieselbe technische Basis wie geschlossene Architekturen: ohne Vendor Lock-in: mit Congestion Management, dynamischem Sub-Millisekunden-Routing und Ultra-Ethernet-Ausrichtung, abgestimmt auf die Burst-Muster kollektiven Datenverkehrs. GPUs verbringen ihre Zeit mit Datenverarbeitung, nicht mit Warten auf das Netzwerk.
Jeder Schwellenwert ist offengelegt, sodass Ihr Team ihn gegen realen xCCL-Traffic (NCCL / RCCL / oneCCL) abstimmen kann. Nachfolgend: jedes Workload-Profil, der zugehörige Mechanismus und das Ergebnis für den Betreiber.
→ DLB bindet Flowlets im Sub-Millisekundenbereich anhand der Queue-Tiefe neu.
→ GLB (OcNOS 7.1) bewertet Leaf · Spine · Super-Spine.
→ DCQCN (xCCL-optimierte ECN + CNP) begrenzen die Rate vor dem Drop.
→ PFC Watchdog entleert blockierte Queues automatisch pro Port.
→ UEC 1.0: Packet Spray + Multi-Path-RDMA + Out-of-Order-Delivery.
→ Der heute beschaffte Switch bleibt im Einsatz, wenn UEC-NICs verfügbar werden.
Referenz-Benchmark. DLB hebt die Auslastung der Fabric von ~55 % bei statischem ECMP auf über 90 % auf derselben Hardware: ohne zusätzliche Uplinks. Lokal an jedem Hop; systemweit über den gesamten AllReduce. (Von Broadcom veröffentlichter Flowlet-Rebalancing-Wert, auf TH4/TH5 reproduzierbar.)
DLB Deep-Dive →800G Spine-Leaf, verlustfrei von Rack zu Rack.
Ein 3-stufiges Clos: eBGP-Unnumbered-Underlay, ECMP auf jeder Ebene, PFC/ECN je Prioritätsgruppe, isolierter Out-of-Band-Bus für ZTP und Telemetrie. Mit dem Mauszeiger über einen Knoten fahren, um Switch, Port-Anzahl und ASIC anzuzeigen.
Fahren Sie über die Knoten, um Details zu Funktionen und Plattformen zu sehen · Vollständige HCL: 40+ validierte Plattformen unter ipinfusion.com/hcl
Vier Schichten der Verlustfreiheit: am ersten Tag korrekt.
Die meisten Ausfälle in einer AI Fabric lassen sich auf eine fehlkonfigurierte PFC-Prioritätsgruppe oder eine für Cloud, nicht für RDMA, abgestimmte ECN-Schwelle zurückführen. OcNOS-DC liefert RoCEv2-Buffer-Profile, qualifiziert je Broadcom-ASIC, damit der erste AllReduce verlustfrei läuft, ohne dass ein Tuning-Sprint nötig wird.
PFC + ECN. verlustfreie Steuerung pro Prioritätsgruppe
PFC pausiert Datenverkehr je Priorität, bevor Puffer überlaufen; ECN markiert Pakete frühzeitig, um den Sender zu drosseln. Keine Drops, kein portweiter Stillstand. PFC over L3 für geroutete Multi-Row-Fabrics.
DLB: adaptives Routing auf Flowlet-Ebene
Statischer Hash-ECMP kollidiert, sobald 8 NICs auf denselben Spine hashen. DLB beobachtet die Queue-Tiefe in Echtzeit und bindet Flowlets im Sub-Millisekundenbereich auf weniger belastete Pfade um: der AllReduce wird nicht länger vom langsamsten Link ausgebremst.
DCBX: Server-Konfiguration automatisch über LLDP verteilt
Der Leaf überträgt die korrekte PFC- und ETS-Konfiguration automatisch an den GPU-Server, ohne stillen Verlust der Lossless-Eigenschaft, wenn ein Node neu provisioniert wird, dem häufigsten Produktions-Fehlermodus.
gNMI-On-Change-Telemetrie: Sichtbarkeit im Sub-Sekundenbereich
PFC-Pausen, ECN-Markierung, DCQCN-Schwellen und Pufferstände als gNMI-On-Change-Sensorpfade, direkt nach Prometheus / Grafana / OpenTelemetry. Congestion wird erkannt, bevor sie einen Job ausbremst.
40+ qualifizierte Plattformen Vollständige HCL →
Das Fabric-Profil ist bereit bevor die NICs es sind. Das ist der Punkt.
RoCEv2 ist 2026 der Produktivtransport; UEC ist der nächste Schritt. Das UEC-1.0-Fabric-Profil ergänzt Packet Spray, Multi-Path-RDMA und Out-of-Order-kompatibles Forwarding, und schließt damit das Single-Hash-Limit, das frühere RoCE-Generationen bei Multi-Rail-Kollektiven hinter InfiniBand zurückhielt. OcNOS-DC orientiert sich an UEC 1.0 Fabric Profil heute, während UEC NICs ausrollen. Es geht nicht darum, beim Standard voranzugehen: alle richten sich an ihm aus. Entscheidend ist, dass der in diesem Quartal beschaffte Switch nicht ersetzt werden muss, wenn die UEC-NIC eintrifft.
Packet Spray
Ein einzelner Flow nutzt alle parallelen Pfade gleichzeitig, statt an einen einzelnen ECMP-Hash gebunden zu sein. Multi-Rail-Bandbreite bleibt nicht länger ungenutzt.
Multi-Path-RDMA
Reorder-Puffer verarbeiten Out-of-Order-Zustellung in Hardware. Moderne Congestion Control ersetzt NACK-basierte Loss Recovery bei der Tail-Latenz.
Gleiche Hardware, Forward Path
Die heute für OcNOS-DC qualifizierten TH4- und TH5-Plattformen reichen bis in UEC hinein. Kein Fork. Keine zweite SKU-Linie. Eine Fabric, zwei Transportgenerationen.
Wo OcNOS-DC einsetzt, ehrlich, namentlich.
Der Wettbewerb hat sich auf einer gemeinsamen Basis angenähert: verlustfreies RoCEv2, DCQCN, Adaptive Routing, UEC-Ausrichtung. Diese Funktionen liefern alle. Der eigentliche Unterschied ist Lösungs-Shape: vertikales Lock-in versus offenes NOS, geschlossene versus offene Hardware, Closed-Loop-IB versus standardisiertes Ethernet. Den Trade-off wählen, mit dem fünf Jahre zu leben ist.
Jede Zeile beschreibt ein tatsächlich verfügbares Produkt, einschließlich OcNOS-DC. Die Frage ist selten ein fehlendes Feature; es ist der Trade-off, mit dem zu leben ist.
Was es tatsächlich ist, und wo es endet.
Ein AI-Cluster besteht aus drei Schichten. Die Fabric bewegt Bytes zwischen Switches; der NIC terminiert RDMA; der Scheduler entscheidet, was wo läuft. „AI-aware Fabric“ bedeutet in der Regel, dass ein einzelner Anbieter alle drei Ebenen unter einer SKU bündelt. OcNOS-DC verantwortet die Fabric, legt jeden Schwellenwert offen und hält sich aus den darüberliegenden Schichten heraus. Die Grenze ist hier klar benannt.
Verantwortungsbereich von OcNOS-DC.
- Verlustfreier RoCEv2-Transport: PFC + ECN + ETS + DCBX
- DCQCN mit xCCL-validierten Standardschwellwerten, jeder Parameter YANG-modelliert
- DLB-Flowlet-Rebinding im Sub-Millisekundenbereich anhand der ASIC-Queue-Tiefe
- GLB-Pfadbewertung über die gesamte Fabric (OcNOS 7.1)
- PFC-Deadlock-Watchdog: pro Port, pro Priorität
- Ausrichtung am UEC-1.0-Fabric-Profil: Packet-Spray-fähiges Forwarding
- gNMI-On-Change-Telemetrie, OpenConfig YANG, Sub-Sekunden-Takt
Aufgabe Ihres NIC-Anbieters.
- Implementierung und Tuning kollektiver xCCL-Operationen
- RDMA-Verbs, Queue Pairs, Retransmit-Logik
- UEC-Packet-Spray-Endpunkt + Reorder-Buffer (UEC-NICs)
- GPU-Direct Memory Access, NVLink-Koordination
- Rate Limiting pro Flow und Congestion-Response am End-Host
Aufgabe Ihrer Orchestrierungsplattform.
- Trainingsjob-Platzierung, Gang Scheduling, Gradient-Sync-Fenster
- Epoch- / Trainingsphasen-Awareness
- Mandantenisolation, Queue-Priorität, Ressourcenquoten
- Zuordnung der xCCL-Ringtopologie, Rail-Group-Affinität
- Erkennung von Cross-Job-Interferenz
Jeder Mechanismus auf dieser Seite hat einen eigenen Deep-Dive.
Die obige Seite dient der Auswahl einer Fabric. Die folgenden Inhalte dienen dem Tuning: Packet Captures, ASIC-Verhalten, YANG-Pfade und welches Feature in welchem Release-Train ausgeliefert wird.
RoCEv2 + PFC + ECN + DCQCN
Die verlustfreie RDMA-Transportschicht für GPU-Kollektivoperationen. Pufferprofile voreingestellt pro Broadcom-ASIC, DCQCN-Standardwerte der xCCL-Klasse, Jitter im Sub-µs-Bereich unter Last.
Deep-Dive lesen → AI Fabric · LokalAdaptive Dynamic Load Balancing (DLB)
Sub-Millisekunden-Flowlet-Rebinding auf Basis von Live-Telemetrie zur ASIC-Queue-Tiefe. Schließt die ECMP-Hash-Kollisionslücke bei AllReduce-Elephant-Flows.
Deep-Dive lesen → AI Fabric · Fabric-weit OcNOS 7.1Global Load Balancing (GLB)
Ende-zu-Ende-Pfadbewertung über Leaf · Spine · Super-Spine für Cluster mit bis zu 16k GPUs. Die Multi-Hop-Adaptive-Schicht, die DLB allein nicht erfasst.
Deep-Dive lesen → AI Fabric · Frontier UEC 1.0Ultra Ethernet (UEC)
Packet Spray, Multi-Path-RDMA, Out-of-Order-Zustellung, moderne Congestion Control. Die standardbasierte offene Antwort auf InfiniBand.
Deep-Dive lesen → AI Fabric · ReferenzdesignsTopologien: Single-Pod bis 16k GPU
Rail-only- und Rail-optimized-Designs bilden die Fabric-Form direkt auf das xCCL-Multi-NIC-Muster mit 8 Rails ab. Dreistufiges Clos für Multi-Pod-Scale-out bis zur Obergrenze von 16.000 GPUs. Port-Zahlen auf TH4 / TH5.
Deep-Dive lesen → AI Fabric · Congestion ControlDCQCN: RDMA-Congestion-Control
WRED-ECN-Marking, CNP-Feedback, quantisierte Ratenregelung. Standardwerte der xCCL-Klasse ab Werk; jeder Schwellenwert ist für das Tuning in YANG modelliert.
Deep-Dive lesen → AI Fabric · SurvivalWatchdog: PFC-Deadlock-Detection
Watchdog je Port und je Priorität erkennt Zyklen pausierter Queues und leert die betroffene Queue automatisch, bevor Trainingsjobs hängen.
Deep-Dive lesen → AI Fabric · EntscheidungsleitfadenInfiniBand vs. Ethernet für AI
Workload-spezifischer Entscheidungsleitfaden. Wo modernes Ethernet (RoCEv2 + DLB + UEC) den Abstand schließt, wo IB weiterhin vorn liegt und wie zu wählen ist.
Deep-Dive lesen → ObservabilitygNMI-Streaming-Telemetrie
gNMI Subscribe über gRPC, OpenConfig YANG, Dial-Out-Collectors. Integrationen mit Telegraf, Prometheus und Grafana.
Deep-Dive lesen →Drei Cluster-Shapes. Drei Fabric-Geschichten.
Gegliedert nach dem, was der Job spürt — nicht nach Switch-Features. Das nächstliegende Profil wählen; die Vertiefungen enthalten die Konfigurationen.
Der mehrwöchige LLM-Pre-Training-Lauf.
AllReduce dominiert das Netzwerk. Jede GPU muss eine hohe In-Collective-Auslastung halten und Mikrobursts überstehen, ohne einen neuntägigen Lauf neu zu starten.
Mechanismen: DCQCN + DLB + PFC-Watchdog. Rail-Optimized für Single-Pod; 3-stufiges Clos mit GLB für Multi-Pod-Scale-out.
Ergebnis: AllReduce mit Line-Rate, null Collective-Restarts, JCT im Zeitplan.
Die High-Throughput-Inferenz-Flotte hinter einer öffentlichen API.
Echtzeit-Inferenz, bei der die p99-Tail-Latenz das SLO bestimmt. Inferenz darf niemals hinter Batch-Retraining warten, und der Betrieb benötigt Sichtbarkeit je Flow in dem Moment, in dem die Latenz abdriftet.
Mechanismen: ETS Strict-Priority + gNMI-On-Change-Telemetrie nach Prometheus / OpenTelemetry.
Ergebnis: p99 innerhalb des SLO gehalten; Regressionen werden in Millisekunden erkannt, nicht erst über den Support.
Die Neocloud, die H100 / H200 / Blackwell an Mandanten vermietet.
Eine Multi-Mandanten-GPU-Cloud. Jeder Mandant benötigt isolierte verlustfreie RoCEv2-Pfade, ohne ein separates Fabric-Segment je Kunde und ohne ein zweites NOS-Image.
Mechanismen: EVPN-VXLAN-Isolation + verlustfreies RoCEv2 auf einer OcNOS-DC-Instanz.
Ergebnis: Isolation pro Mandant, ein Betriebsmodell, ein SLA, ein Image für Upgrades.
Bringen Sie Ihre Topologie mit. Wir zeigen Ihnen den Weg.
Jeder Architektur-Review von IPI wird von einem Netzwerk-Engineer geführt, der OcNOS im Produktivbetrieb betreibt: keine Folien, keine Vertriebsinszenierung. GPU-Anzahl, NIC-Auswahl und Ziel-JCT mitbringen; die Abbildung auf Topologie, SKUs und heute lieferbare Konfigurationen erfolgt im Gespräch.
Verbinden Sie es mit alles andere.
KI ist ein Segment des Data Center. DC Fabric und DCI erweitern dasselbe OcNOS-Image auf Compute, Storage und Remote-Standorte: dasselbe NOS, dieselbe CLI, dasselbe SLA.
Ehrlich gesagt FAQ.
OcNOS 800G Ethernet-basierte verlustfreie AI Fabric
Kurzes Formular. Ihr PDF wird unmittelbar nach dem Absenden heruntergeladen.
✓ Opening your PDF in a new tab…
If it didn't open, use the link below.
Solution_Brief-OcNOS_800G_Ethernet-Based_Lossless_AI_Fabric.pdfEVPN-VXLAN Data Center Fabric
Kurzes Formular. Ihr PDF wird unmittelbar nach dem Absenden heruntergeladen.
✓ Opening your PDF in a new tab…
If it didn't open, use the link below.
OcNOS-modernize-your-data-center-EVPN-VxLAN_Solution-Brief.pdfAI fabric & DC deployments
Produktive AI-Cluster und Data-Center-Fabrics, die OcNOS-DC auf Broadcom Tomahawk 4/5 betreiben.

NTT DATA ist eine Partnerschaft mit IP Infusion eingegangen, um disaggregierte Open-Networking-Lösungen auf den Markt zu bringen, und bietet OcNOS-basierte Cell Site Router, Routed…

Scott Data hat OcNOS mit Open-Networking-Hardware von UfiSpace, Edgecore Networks und Celestica implementiert und damit Legacy-Vendor-Stacks in seinem gesamten…

Madeo Consultant, ein in Frankreich ansässiger Rechenzentrums-Systemintegrator, hat Cisco Nexus- und Catalyst-Switches durch IP Infusion OcNOS auf Edgecore… ersetzt

Prosoluce, ein französischer ISP und Anbieter von Managed Services, rüstete seinen Core auf ein 100G-EVPN-VXLAN-Backbone mit IP Infusion OcNOS auf…
Passend aus dem Blog
Das AI Network Decision Framework: GPU-Fabric für Geschwindigkeit, ROI, strategische Freiheit
Framework auf Käuferseite für Entscheidungen zur GPU-Fabric mit RoCEv2 und offener Hardware
Beitrag lesen →OcNOS 7.0 für Rechenzentren: AI Fabric, 800G-Plattformen, EVPN-VXLAN im großen Maßstab
800G-AI-Fabric-Features und Tomahawk-5-Plattformen, die in OcNOS 7.0 ausgeliefert werden
Beitrag lesen →OcNOS 7.0: What's New for AI, Transport, and Cloud
Hebt verlustfreien RoCEv2-Transport mit PFC für GPU-Cluster hervor
Beitrag lesen →OcNOS 6.6 für Rechenzentren: AI Fabric PFC/ETS, EVPN Policy, 400G
Verlustfreie PFC/ETS-DCB-Features, die OcNOS-AI-Fabric-Deployments zugrunde liegen
Beitrag lesen →