Monstruo de red de 102 terabits: Cisco muestra en qué funcionará realmente la IA del futuro

Monstruo de red de 102 terabits: Cisco muestra en qué funcionará realmente la IA del futuro

Mientras todos hablan de chatbots, los ingenieros están cambiando las reglas del juego en los centros de datos.

image

Cisco presentó una nueva generación de microchip de red para infraestructuras de inteligencia artificial de alta carga y anunció su entrada en el segmento de conmutadores ultrarrápidos. La solución está dirigida a grandes clústeres de entrenamiento e inferencia de modelos, donde los requisitos de ancho de banda y de latencia siguen aumentando rápidamente.

La compañía anunció el microchip Silicon One G300 con una capacidad de 102,4 Tbit por segundo. Está diseñado para competir con soluciones similares de Broadcom y Nvidia. El chip emplea 512 interfaces de alta velocidad de 200 Gbit por segundo cada una. Esa configuración permite construir infraestructuras con hasta 128 000 aceleradores gráficos con aproximadamente 750 conmutadores en lugar de los 2 500 anteriores. Al agrupar los enlaces, se admite una velocidad de puerto de hasta 1,6 Tbit por segundo.

La diferencia clave, según Cisco, es su propio mecanismo de procesamiento de red colectivo. Utiliza un búfer de paquetes totalmente compartido y balanceo de carga basado en rutas de transmisión. Según el vicepresidente sénior Rakesh Chopra, esto ayuda a suavizar picos de tráfico, reducir latencias y aumentar la utilización de los enlaces en tareas de IA y en servicios frontales. Los algoritmos supervisan los flujos y los tramos de la red saturados, sincronizan los datos entre conmutadores y conforman una visión general del estado del clúster.

Métodos similares de gestión de congestión ya son utilizados por otros fabricantes. No obstante, Cisco afirma un aumento de la eficiencia en el uso de los enlaces del 33% y una reducción del tiempo de entrenamiento de modelos de hasta un 28% en comparación con enfoques que distribuyen paquetes por múltiples rutas. Estas estimaciones se basan en pruebas internas del fabricante.

Una característica adicional es la programabilidad en el lenguaje P4. Permite cambiar las funciones del equipo y añadir nuevas capacidades mediante actualizaciones de software sin sustituir el hardware. Según la compañía, este enfoque prolonga la vida útil de las plataformas de red y facilita la adaptación a nuevos estándares.

El G300 se utilizará tanto en los dispositivos propios de Cisco de las series N9000 y 8000 como se comercializará en el mercado abierto de microchips. Los equipos tendrán 64 puertos en formato OSFP con velocidades de hasta 1,6 Tbit por segundo.

De forma simultánea se presentó un conjunto de nuevos módulos ópticos. Aparecieron soluciones enchufables a 1,6 Tbit por segundo con la posibilidad de dividirse en ocho líneas de 200 Gbit. También se lanzaron módulos de línea a 800 Gbit sin procesadores de señal integrados, lo que reduce el consumo energético. En ese caso, el procesamiento de la señal se realiza en el propio chip. En conjunto con los nuevos sistemas, el fabricante espera una reducción del consumo energético de los conmutadores de aproximadamente un 30%.

La compañía aún no lanza la tecnología de óptica integrada dentro del encapsulado del microchip a productos comerciales, aunque anteriormente mostró prototipos funcionales. La solución está en fase de evaluación de su preparación para el mercado.

Además, se ha ampliado la disponibilidad del microchip de enrutamiento Silicon One P200 con una capacidad de 51,2 Tbit por segundo. Está destinado a conectar centros de datos y clústeres de IA a distancias de hasta 1000 km. Las entregas de los nuevos chips y del equipo basado en ellos están previstas para finales de año.