La red neuronal asceta de Microsoft: BitNet piensa con solo tres cifras y funciona en un portátil común

La red neuronal asceta de Microsoft: BitNet piensa con solo tres cifras y funciona en un portátil común

¡Cuando “menos” significa “más rápido”!

image

Especialistas de Microsoft han desarrollado la red neuronal más grande de su clase: BitNet b1.58 2B4T, capaz de operar incluso en procesadores convencionales, incluidos los chips Apple M2. El modelo se distribuye bajo licencia MIT y pertenece a una clase especial de sistemas conocida como “bitnets”.

La principal característica de esta innovación radica en su enfoque revolucionario hacia la compresión de datos. Mientras las redes neuronales tradicionales trabajan con valores numéricos complejos, las bitnets solo utilizan tres estados: -1, 0 y 1. Esto reduce drásticamente los requisitos de recursos computacionales y memoria.

Los desarrolladores destacan especialmente que su modelo es el primero entre las bitnets en alcanzar los 2 mil millones de parámetros. Para su entrenamiento se utilizó un impresionante conjunto de datos de 4 billones de tokens, equivalente al contenido de 33 millones de libros.

En las pruebas, BitNet demostró resultados impresionantes, superando a otros modelos de tamaño similar. La red compite exitosamente con desarrollos como Llama 3.2 1B de Meta, Gemma 3 1B de Google y Qwen 2.5 1.5B de Alibaba. Obtuvo altos puntajes tanto en pruebas de matemáticas de nivel escolar (GSM8K) como en evaluación de sentido físico común con el benchmark PIQA.

El rendimiento merece especial atención. BitNet b1.58 2B4T no solo iguala a sus competidores en precisión, sino que también los supera considerablemente en velocidad de procesamiento —en algunos casos duplicando su rendimiento. Además, consume significativamente menos memoria RAM.

Sin embargo, existen limitaciones. Para alcanzar los niveles prometidos, es necesario utilizar el framework bitnet.cpp de Microsoft, que por ahora solo es compatible con un conjunto limitado de procesadores. Curiosamente, el hardware compatible no incluye aceleradores gráficos, que actualmente forman la base de la infraestructura de inteligencia artificial.

A pesar de esto, el concepto de las bitnets resulta muy prometedor, especialmente para dispositivos con recursos computacionales limitados. Aun así, la cuestión de la compatibilidad con diferentes plataformas de hardware sigue siendo un factor clave que puede influir en la adopción futura de esta tecnología.

¿Estás cansado de que Internet sepa todo sobre ti?

¡Únete a nosotros y hazte invisible!