El fin de la era eléctrica: los centros de datos adoptan tecnologías de luz

El fin de la era eléctrica: los centros de datos adoptan tecnologías de luz

Nvidia desafía las leyes de la física en la carrera por la eficiencia de la IA.

image

La semana pasada, durante la conferencia GTC en San José, Nvidia presentó un nuevo conmutador de red óptico de principio completamente novedoso. El dispositivo está diseñado para reducir radicalmente el consumo energético de los centros de datos que dan soporte a sistemas de inteligencia artificial. La base del desarrollo es la tecnología de óptica coempacada (co-packaged optics, CPO), que permite transmitir decenas de terabits de datos por segundo entre racks de servidores.

Paralelamente, el fabricante Micas Networks anunció el inicio de la producción en serie de un dispositivo similar basado en la tecnología de Broadcom. Se avecinan cambios en el mercado de soluciones ópticas: la infraestructura existente no puede hacer frente al creciente apetito de los sistemas de cómputo.

Hoy en día, el equipamiento de red en las salas de servidores se basa en chips especializados conectados eléctricamente a transceptores ópticos. Estos módulos incluyen láseres, circuitos ópticos, procesadores de señal y otros componentes electrónicos que convierten los bits electrónicos en fotones que viajan por la fibra óptica.

En los centros de datos modernos, la óptica conectable consume aproximadamente el 10 % de la potencia total de los cálculos por GPU. Con 400 000 aceleradores gráficos, el consumo energético alcanza los 40 megavatios. Más de la mitad de esta energía se destina solo a alimentar los láseres de los módulos de comunicación.

La tecnología CPO acerca al máximo la conversión de señales al chip principal. Los métodos de empaquetado avanzados permiten rodearlo de elementos ópticos de silicio. La fibra óptica se conecta directamente al encapsulado.

Gracias a la nueva arquitectura, el número de láseres necesarios se reduce en un factor de cuatro. La eficiencia de la transmisión de información aumenta 3,5 veces, y la estabilidad de las señales entre máquinas mejora 63 veces. La resistencia a fallos será diez veces mayor y el tiempo de implementación del equipo se reducirá en un 30 %.

Nvidia lanzará dos modelos: Spectrum-X y Quantum-X. Este último saldrá este mismo año y funcionará con tecnología InfiniBand optimizada para tareas de alto rendimiento. Cada uno de sus 144 puertos podrá transmitir 800 gigabits por segundo. Dos elementos clave del sistema se refrigerarán con líquido en lugar de aire.

La tecnología integrada SHARP FP8 ayudará a descargar los procesadores principales, trasladando parte de las operaciones al componente de red. El modelo Ethernet Spectrum-X ofrecerá un ancho de banda de unos 100 terabits por segundo a través de 128 o 512 canales. La versión superior podrá manejar 400 terabits a través de 512 o 2048 salidas.

En su desarrollo, Nvidia empleó moduladores basados en resonadores de anillo micrométrico en lugar del esquema tradicional de Mach-Zehnder. En este último, el flujo de luz se divide en dos partes paralelas, cada una de las cuales cambia bajo la influencia de un campo eléctrico. Al combinarse, se cancelan o refuerzan mutuamente, formando la señal final.

La solución de anillo micrométrico es más compacta, pero requiere calentadores integrados debido a su sensibilidad térmica. La opción clásica ocupa más espacio y dispersa más luz. En el nuevo enfoque, el rayo pasa cerca de una estructura en forma de anillo: si la longitud de onda permite crear una onda estacionaria, se filtra. La longitud deseada la determina el índice de refracción, regulado por la electrónica.

En la estructura de Quantum-X se emplean 18 elementos fotónicos de silicio en cada uno de los dos bloques principales. Todos ellos están conectados a un par de láseres y a 16 fibras. Para garantizar el funcionamiento confiable de un sistema tan complejo, los ingenieros tuvieron que desarrollar nuevos métodos de prueba.

El desarrollo de Micas Networks ya ha entrado en producción. Está basado en la tecnología Broadcom Bailly con un bloque funcional unificado. Alrededor del chip central Tomahawk 5 hay ocho módulos ópticos, cada uno de los cuales procesa un flujo de 6,4 terabits por segundo. A diferencia de la solución de Nvidia, aquí se utiliza refrigeración por aire.

En comparación con los enfoques tradicionales, el nuevo sistema consume un 40 % menos de energía. Gracias al esquema de señal más simple, se ha incrementado la fiabilidad: las interrupciones breves de conexión ocurren con menor frecuencia.

Los moduladores de silicio en los bloques ópticos de Nvidia funcionan a una velocidad de 200 gigabits por segundo. En el futuro, se espera aumentar esta cifra a 400 gigabits. Para escalar aún más la velocidad, será necesaria la integración de otros materiales, como niobato de litio y fosfuro de indio.

Mientras las grandes empresas perfeccionan los canales troncales, startups como Avicena, Ayar Labs y Lightmatter trabajan en conexiones ópticas a nivel de procesador. Las dos primeras han creado componentes especiales para colocarse junto a los núcleos de cálculo. Lightmatter apunta aún más alto: planea utilizar un módulo fotónico como base para el empaquetado tridimensional de los chips del futuro. Habrá que estar atentos a cómo evoluciona gradualmente el mercado y confiar en que nos espera un futuro brillante.

Las huellas digitales son tu debilidad, y los hackers lo saben

¡Suscríbete y descubre cómo borrarlas!