BCM56780 · TSMC 7 nm · 1RU 32×400G con iPo-DWDM

Broadcom Trident 4 Switches Trident 4 12.8 Tbps · 32 × 400G · el leaf de DC moderno.

Dos plataformas abiertas 1RU 32×400G validadas en OcNOS-DC: Edgecore AS9726-32DB and UfiSpace S9300-32D. El chip de clase DC-leaf con margen iPo-DWDM: óptica coherente 400G ZR/ZR+ directa en la jaula, sin necesidad de un transponder shelf.

12.8Tbps
Capacidad del switch
32×400G
Radix de puertos nativo
1RU
Factor de forma
2SKUs
OcNOS-Validated
400GZR
Listo para iPo-DWDM
01
Los switches
Hardware abierto que ejecuta Trident 4

Dos SKU hermanos de 1RU. Una sola imagen de OcNOS-DC.

La misma clase arquitectónica (32 × QSFP-DD sobre Broadcom BCM56780), distintos ODMs. Ambos se entregan precargados con ONIE y ejecutan la misma imagen de OcNOS-DC. Las diferencias son el enfoque de adquisición y qué relación de proveedor se adapta mejor a su flota. Cada tarjeta enlaza a la hoja de datos completa del proveedor (PDF, alojado localmente).

Edgecore· serie DCS
DC leaf · 400G

AS9726-32DB

Validado en OcNOS-DC · ONIE precargado
Ports
32 × QSFP-DD (400G)Breakout: 2×200 / 4×100 / 8×50 (hasta 256 lógicos)
Form
1RU · 438.4 × 500 × 43.4 mm
Power
~1500 W típico · redundante de intercambio en caliente~47 W por jaula QSFP-DD
CPU
Intel Xeon D · 2 GB de RAM
▌ Elija esto cuando

DC leaf de 400G con margen iPo-DWDM: óptica conectable 400G ZR/ZR+ directa en el spine, sin transponder. SKU con marca Edgecore.

UfiSpace· Serie S9300
DC leaf · 400G

S9300-32D

Validado en OcNOS-DC · ONIE precargado
Ports
32 × QSFP-DD (400G)Breakout: 2×200 / 4×100 / 8×50 (hasta 256 lógicos)
Form
1RU · 440 × 500 × 43.5 mm
Power
~1500 W típico · redundante de intercambio en caliente~47 W por jaula QSFP-DD
CPU
Intel Xeon D · 2 GB de RAM
▌ Elija esto cuando

La misma clase arquitectónica que la AS9726-32DB. Elija por relación con el ODM, economía de la BoM o por dónde las plataformas UfiSpace ya dominan el resto de su flota.

· Cómo encaja TD4 junto al resto del portafolio de OcNOS

vs Tomahawk 4El TD4 ofrece la mitad de la capacidad en la mitad del espacio de rack: clase leaf de DC. TH4 (25.6 Tbps) es para roles de spine/agregación donde importa el búfer profundo.
vs Tomahawk 5TD4 is 400G; TH5 (51.2 Tbps) es 800G. Combínelos: TD4 leaf, TH5 spine, en fabrics de IA más grandes.
vs Trident 3El TD3 llega como máximo a puertos de 100G; el TD4 es la ruta de actualización moderna a 400G. Compatibilidad directa con OcNOS-DC.
ventaja de iPo-DWDMJaulas QSFP-DD con el presupuesto de potencia para coherente 400G ZR/ZR+. DCI metropolitano sin un estante de transpondedores.
02
Dentro del silicio
Silicio merchant de clase leaf para DC

Trident 4: diseñado específicamente para el rol de leaf de DC.

The BCM56780 Trident 4 es el ASIC merchant de leaf de DC de 12,8 Tbps de Broadcom: la mitad de la capacidad de Tomahawk 4 a un costo por puerto sustancialmente menor. El radix nativo es 32 × 400G (o 64 × 200G, 128 × 100G mediante breakout). Construido sobre TSMC de 7 nm con SerDes PAM4 de 50G: 256 carriles, 8 carriles por jaula QSFP-DD.

Lo que hace del TD4 un chip específico para leaf y no un chip más pequeño de la serie TH: optimizado para reenvío este-oeste en lugar de agregación de spine. Grupo de búfer más pequeño (se ajusta a los patrones de carga de trabajo de leaf), dimensionamiento de tabla más ajustado para el rol VTEP de VXLAN/EVPN, menor envolvente de potencia por puerto. La compensación es consciente. El TD4 no es el spine adecuado para un clúster de 16k GPU, pero sí es el leaf adecuado para uno.

Verificado de forma cruzada con los Página de producto BCM56780.

ProcessTSMC N7 SeriesStrataXGS RoleDC Leaf SerDes50G PAM4 · 256 carriles Ópticaslisto para iPo-DWDM

· Cómo se ve 32 × 400G

Chip BCM5678012,8 Tbps
256 carriles × 50G PAM4 = 12,8 Tbps. Ocho carriles por jaula → 400G. Caja de 1RU · presupuesto de ~47 W/jaula que admite 400G ZR coherente.
Cuatro decisiones de diseño que importan

Por qué TD4 tiene la forma correcta para el leaf de DC moderno.

Diferente de la serie TH de forma deliberada, cada decisión optimizada para la carga de trabajo de leaf en lugar de la capacidad de spine.

PRINCIPLE 01

Dimensionado adecuadamente para el tráfico este-oeste.

12,8 Tbps en 1RU es la forma natural de un leaf de DC: gestiona 32 enlaces ascendentes de 400G hacia el spine, más 64 enlaces descendentes de 100G hacia los servidores (mediante breakout), sin sobreaprovisionar silicio para una capacidad que no se utilizará.

12.8 Tbps · 1RU
PRINCIPLE 02

Presupuesto de jaulas iPo-DWDM.

Las jaulas QSFP-DD del AS9726-32DB y del S9300-32D están dimensionadas para ~47 W/puerto, suficiente para óptica coherente conectable de 400G ZR y OpenZR+. Conecte un módulo coherente directamente al leaf para un DCI metropolitano sin transpondedor.

~47 W/jaula · listo para 400G ZR
PRINCIPLE 03

EVPN-VXLAN a velocidad de línea.

Encapsulación/desencapsulación VXLAN acelerada por hardware con un escalado adecuado de VTEP. Multihoming ESI-LAG en el leaf, IRB simétrico/asimétrico y plano de control BGP EVPN completo sobre OcNOS-DC.

VXLAN VTEP · ESI-LAG
PRINCIPLE 04

El mismo NOS que la spine.

La misma imagen de OcNOS-DC que se ejecuta en los spines TH4 y TH5 se ejecuta en los leaves TD4. Un modelo de configuración, una superficie de automatización y un canal de telemetría en toda la fabric. Sin un sistema operativo específico de leaf que mantener.

OcNOS-DC · imagen unificada
03
Salto generacional
Trident 3 → Trident 4

Capacidad cuadruplicada. Velocidad de puerto cuadruplicada. La misma función de DC leaf.

El TD3-X7 (3,2 Tbps · 32×100G · 16 nm · 25G NRZ) fue el leaf de trabajo de la era 2018-2022. El TD4 cuadruplicó la hoja de especificaciones en el mismo formato de 1RU. El rol no cambió: el leaf de DC moderno simplemente es más grande.

Capacidad de conmutación
3.2 Tbps 12,8 Tbps

4× de capacidad en el mismo 1RU. El mismo espacio en rack, cuatro veces el rendimiento.

Velocidad de puerto nativa
100G QSFP28 400G QSFP-DD

4× la velocidad por puerto. El mismo radix de 32 puertos, pero cada puerto transporta cuatro veces más.

Nodo de proceso
16 nm 7 nm

Reducción en dos pasos. La potencia por Gbps cae drásticamente: lo que necesita el 400G ZR coherente.

Óptica coherente
Pluggables SR/LR 400G ZR/ZR+

El presupuesto de la jaula QSFP-DD aloja coherente. iPo-DWDM fue una llegada de la era TD4.

Continuity: la misma imagen de OcNOS-DC se ejecuta en TD3 y TD4. La renovación brownfield mantiene intactas las configuraciones de EVPN, los peerings de BGP, las suscripciones de gNMI y los playbooks de Ansible: la capacidad se cuadruplica, el modelo operativo permanece. Página de Trident 3 →
04
Qué incluye OcNOS-DC
OcNOS-DC en este silicio

Leaf de nivel operador. Óptica coherente. RoCEv2 sin pérdidas.

El leaf TD4 obtiene la misma superficie de funciones OcNOS-DC que el spine, además de la maquinaria iPo-DWDM para DCI sin transpondedores cuando el leaf también actúa como punto de extensión metropolitana.

EVPN-VXLAN Leaf

BGP EVPN con IRB simétrico/asimétrico.

Plano de control EVPN completo conforme a RFC 7432 en el leaf. Multihoming ESI-LAG para conexión activo/activo de servidores, convergencia con mass-withdraw, derivación automática de route-target. El spine TH y el leaf TD comparten la misma imagen EVPN, por lo que establecen peering directamente.

iPo-DWDM

400G ZR / ZR+ directo en la jaula.

Óptica coherente pluggable con ajuste DWDM completo, ajuste de FEC y gestión OIF/CMIS, todo gobernado a través de gNMI de OcNOS. No se requiere estante de transpondedores para el DCI metropolitano.

RoCEv2 sin pérdidas

PFC + ECN + DCQCN.

Toolkit RoCEv2 completo en el leaf: los mismos valores por defecto ajustados a colectivos xCCL (NCCL / RCCL / oneCCL) que en el spine TH5.

Telemetría en streaming

gNMI / OpenConfig.

Contadores por puerto, estado de la capa óptica (BER, dispersión, OSNR para ZR), recuentos de pausa PFC. Se integra con Prometheus/Grafana.

Red real

BGP · OSPF · IS-IS · SR-MPLS.

Pila completa de enrutamiento en el leaf. Trátelo como un router real, no como un switch L2 plano.

Superficie de funciones validada

La misma imagen de OcNOS-DC que el resto del fabric.

Enrutamiento Layer 3 · L1/L2 · primitivas de AI/ML fabric · Multicast · QoS · Seguridad · Hardware · Gestión. Validación por plataforma visible en la OcNOS Feature Matrix pública.

EVPN-VXLAN ESI-LAG RoCEv2 / PFC DCQCN 400G ZR / ZR+ BGP / OSPF / IS-IS SR-MPLS gNMI / NETCONF ZTP
Day-0 to Day-2

ZTP. gNMI on-change. NETCONF + YANG. DCBX.

Ponga en marcha un leaf TD4 en el rack con aprovisionamiento sin intervención. Transmita cada contador, incluido el estado de la capa de óptica coherente, a su stack de observabilidad. Sin scripts de pegamento.

ZTP IPv4/IPv6 gNMI NETCONF OpenConfig YANG Óptica CMIS Ansible Proveedor de Terraform
Quién construye este stack

Tres perfiles de operador. Un silicio de clase leaf.

El mismo silicio TD4, tres roles distintos en el DC, cada uno aprovechando diferentes facetas del mismo chip.

Operador de DC · Leaf 400G

La actualización del leaf de 400G desde un fabric de 100G.

"Hoy nuestro leaf del DC es 100G QSFP28. Las densidades de rack están aumentando. Necesitamos 400G hasta el leaf, pero no estamos listos para rediseñar el spine."

Leaf TD4 a 32×400G con breakout 4× hacia servidores de 100G. El mismo lenguaje de configuración EVPN-VXLAN que la fabric TD3 a la que reemplazan. La misma imagen OcNOS-DC. El spine no cambia.

DC · renovación de leaf
DCI metropolitano · iPo-DWDM

Extensión metro sin transpondedor.

"Tenemos dos centros de datos separados por 80 km. El grupo de óptica quiere retirar el estante de transpondedores. El grupo de red quiere 400G entre ellos. Compras quiere una sola caja, no dos capas."

Leaf TD4 con pluggables 400G ZR directamente en cajas QSFP-DD. EVPN inter-DC extiende la fabric L2/L3. La capa óptica se colapsa dentro de la capa IP. Una sola caja, ambas capas.

DCI · Metro
Clúster de IA · Pequeño / Mediano

Clúster de GPU de un solo pod sobre un fabric de un solo nivel.

"Nuestro clúster tiene 32 servidores GPU con NIC a 100G. No necesitamos un Clos multinivel. Pero queremos RoCEv2 sin pérdidas y la opción de crecer."

Un par de conmutadores TD4 forma un fabric de un solo tier para un clúster mono-pod con NIC 100G (breakout 4×). RoCEv2 sin pérdidas de servidor a conmutador, DCQCN ajustado para xCCL, ESI-LAG para cómputo multi-homed. Añada una spine TH4 o TH5 para escalar a multi-pod.

DC · AI Fabric pequeño
Preguntas frecuentes

Las preguntas que los arquitectos realmente hacen.

Dos plataformas de hardware abierto de 1RU y 32×400G: Edgecore AS9726-32DB and UfiSpace S9300-32D. La misma clase arquitectónica (32×QSFP-DD sobre Broadcom BCM56780), distintos ODM. Ambos se envían con ONIE precargado y ejecutan la misma imagen de OcNOS-DC que los spines TH5 y los switches de agregación de búfer profundo TH4.
El TD4 (BCM56780) ofrece 12,8 Tbps en 1RU con 32×400G, la mitad de la capacidad del TH4 (BCM56996), que ofrece 25,6 Tbps en 2RU con 64×400G. El TD4 es el DC-leaf-class chip: caja más pequeña, menor consumo, menor costo por puerto. El TH4 es el spine/aggregation-class chip con buffer profundo HBM opcional. En un fabric leaf-spine: TD4 en el leaf, TH4 o TH5 en el spine. La misma imagen OcNOS-DC se ejecuta en ambos.
Sí, cuando el clúster es lo suficientemente pequeño. Un spine de 12,8 Tbps admite un fabric de un solo nivel con 32 leaves y 32×400G de enlaces de subida, dimensionado para clústeres en el rango de 256 a 512 GPU con NIC de 100G, o hasta ~128 GPU con NIC de 400G. Por encima de eso, el spine requiere capacidad TH4 (25,6 Tbps) o TH5 (51,2 Tbps) para un escalado Clos adecuado. OcNOS-DC gestiona los tres de forma idéntica.
IP-over-DWDM. Tanto AS9726-32DB como S9300-32D cuentan con Cages QSFP-DD con el presupuesto de potencia para ópticas coherentes enchufables 400G ZR y OpenZR+. Conecte un módulo coherente directamente en el leaf: sin estante de transpondedor separado, sin muxponder. Para el DCI metro entre dos switches leaf, la capa óptica se colapsa en la capa IP. Ahorra CapEx, OpEx y unidades de rack.
Sí. TD4 tiene la misma arquitectura de buffer compartido de Broadcom y las mismas primitivas PFC + ECN que la serie TH. OcNOS-DC ofrece PFC, ETS, ECN dinámico, DCQCN y PFC Deadlock Detection & Recovery en las plataformas TD4. El enrutamiento adaptativo (DLB) cuenta con soporte del ASIC y es configurable. La capacidad de 12.8 Tbps hace que TD4 sea una buena opción para el leaf en un fabric de IA de tamaño pequeño a mediano: RoCEv2 sin pérdidas desde el servidor hasta el leaf, y luego sin pérdidas a través del spine en TH4 o TH5.
Para puertos de 800G hoy (use TH5). Para leaf de DC puro de 100G/25G donde el clúster está por debajo de ~64 servidores (TD3-X7 es mucho más económico). Para borde SP o núcleo de operador (use Qumran o Jericho: conjunto de funciones distinto). Para roles de DCI donde el equipo debe absorber ráfagas profundas (use TH4 con HBM). El punto fuerte de TD4 es el "leaf de DC moderno de 400G con margen para iPo-DWDM".
Una nota sobre el ingreso de datos. El número de parte público de Broadcom para el Trident 4 es BCM56780; BCM56990 is Tomahawk 4. El registro de administración de HCL puede usar una etiqueta no estándar, pero el silicio que se incluye en el AS9726-32DB y el S9300-32D es la familia BCM56780 Trident 4. Coteje con las hojas de datos vinculadas de Edgecore y UfiSpace si los números de parte exactos son relevantes para su adquisición.

¿Diseñar un leaf de DC de 400G con margen para iPo-DWDM?

Sesión de arquitectura de 30 minutos con un arquitecto de red de OcNOS. Traiga el diseño de su DC, el número de servidores y los requisitos de DCI, y salga con un BoM dimensionado en torno a AS9726-32DB / S9300-32D y un plan de ubicación frente al spine de clase TH.

References

Trident 4 references & further reading