El nuevo prototipo de chip, desarrollado por investigadores de IBM Research en EE UU, combina la computación y la memoria para procesar datos de manera eficiente con menor consumo energético.
Investigadores del laboratorio de IBM Research Almadén (California) han presentado en el último número de Science el chip NorthPole, una arquitectura inspirada en el cerebro que combina la computación con la memoria para procesar datos de forma eficiente a bajo coste energético.
Desde sus inicios, la informática se ha centrado en el procesador, separando la memoria del cálculo. Sin embargo, transportar grandes cantidades de datos entre la memoria y el cálculo tiene un alto coste en términos de consumo de energía, ancho de banda y velocidad de procesamiento.
Transportar grandes cantidades de datos entre la memoria y el cálculo tiene un alto consumo de energía, ancho de banda y velocidad de procesamiento
Como resultado, la mayoría de las arquitecturas informáticas contemporáneas están alcanzando rápidamente cuellos de botella físicos y de procesamiento y corren el riesgo de volverse insostenibles desde el punto de vista económico, técnico y medioambiental, dados los crecientes costes energéticos que conllevan.
Sin embargo, el nuevo prototipo de chip, que lleva casi dos décadas desarrollándose, tiene el potencial de cambiar drásticamente la forma en que se podrá ampliar eficazmente los potentes sistemas de hardware de la IA, señalan los autores del trabajo.
Desde el nacimiento de la industria de los semiconductores, los chips informáticos han seguido principalmente la misma estructura básica, en la que las unidades de procesamiento y la memoria que almacena la información a procesar se almacenan de forma discreta.
El chip NorthPole en una tarjeta PCIe. / IBM Research
Aunque esta estructura ha permitido diseños más sencillos y escalables a lo largo de las décadas, ha creado lo que se denomina el cuello de botella de von Neumann, en el que se necesita tiempo y energía para intercambiar continuamente datos entre la memoria, el procesamiento y cualquier otro dispositivo de un chip.
El trabajo de Dharmendra Modha, de IBM Research, y sus colegas pretende cambiar esta situación inspirándose en la forma en que computa el cerebro.“Forja un camino completamente distinto al de la arquitectura von Neumann”, según Modha.
En ensayos con modelos de reconocimiento de imágenes y detección de objetos, NorthPole ha demostrado mayor eficiencia energética y espacial y menor latencia que los chips actuales
“Gran avance en la arquitectura de chips”
Según Modha, NorthPole es un gran avance en la arquitectura de chips que ofrece enormes mejoras en eficiencia energética, espacial y temporal. Utilizando el modelo ResNet-50, el chip es considerablemente más eficiente que las unidades de procesamiento gráfico (GPU, por sus siglas en inglés) de 12 nm y las unidades centrales de procesamiento (CPU). En ambos casos, el prototipo es 25 veces más eficiente desde el punto de vista energético, en lo que se refiere al número de fotogramas interpretados por julio de energía requerida.
El chip se ha fabricado con un proceso de nodo de 12 nm y contiene 22.000 millones de transistores en 800 milímetros cuadrados. Tiene 256 núcleos y puede realizar 2.048 operaciones por núcleo y ciclo con precisión de 8 bits, con potencial para duplicar y cuadruplicar el número de operaciones con precisión de 4 y 2 bits, respectivamente
Contiene 22.000 millones de transistores en 800 milímetros cuadrados. Tiene 256 núcleos y puede realizar 2.048 operaciones por núcleo y ciclo con precisión de 8 bits
Modha, en el centro, con la mayor parte del equipo que trabaja en NorthPole.
Una de las mayores ventajas de NorthPole, explican los autores, es que toda la memoria del dispositivo está en el propio chip, en lugar de conectarse por separado. Sin ese cuello de botella de von Neumann, puede realizar inferencias de IA considerablemente más rápido que otros chips ya existentes en el mercado.
Difumina la frontera entre cálculo y memoria
“La arquitectura de NorthPole difumina la frontera entre cálculo y memoria», afirma Modha. “A nivel de núcleos individuales, aparece como ‘memoria cerca del cómputo’ y desde fuera del chip, a nivel de entrada salida, aparece como una memoria activa». Esto hace que sea fácil de integrar en los sistemas y reduce significativamente la carga en la máquina anfitriona.
Pero la mayor ventaja del chip es también una limitación: solo puede tirar fácilmente de la memoria que lleva incorporada. Todo el aumento de velocidad posible en el chip se vería mermado si tuviera que acceder a la información desde otro lugar.
Gracias a un enfoque denominado ‘scale-out’, NorthPole puede soportar redes neuronales más grandes dividiéndolas en subredes más pequeñas que quepan en la memoria modelo del chip, y conectando estas subredes entre sí en varios chips NorthPole.
Así pues, aunque en uno de estos chips (o en un conjunto de ellos) hay memoria suficiente para muchos de los modelos útiles para aplicaciones específicas, este chip no está pensado para ser un multitalento. “No podemos ejecutar GPT-4 con él, pero sí muchos de los modelos que necesitan las empresas”, afirma Modha.
El dispositivo no necesita voluminosos sistemas de refrigeración líquida para funcionar, lo que significa que podría desplegarse en algunos espacios más bien pequeños
Aunque la investigación sobre el chip NorthPole sigue su curso, su estructura se presta a casos de uso de IA emergentes, así como a otros más consolidados.
Coches autónomos, robótica y satélites
En las pruebas, el equipo de NorthPole se centró principalmente en usos relacionados con la visión por ordenador, en parte, porque la financiación del proyecto procedía del Departamento de Defensa de EE UU.
Algunas de las principales aplicaciones fueron la detección, la segmentación de imágenes y la clasificación de vídeos. Pero también se probó en otros ámbitos, como el procesamiento del lenguaje natural (con el modelo BERT de codificador único) y el reconocimiento del habla (con DeepSpeech2). En la actualidad, el equipo está explorando la asignación de grandes modelos de lenguaje solo con decodificador a sistemas escalables NorthPole.
En las pruebas, el equipo se centró principalmente en usos como la visión por ordenador, en parte, porque la financiación del proyecto procedía del Departamento de Defensa de EE UU
También se podría emplear en satélites que vigilen la agricultura y gestionen las poblaciones de animales salvajes, controlen los vehículos y el transporte de mercancías, manejen robots de forma segura y detecten ciberamenazas, destacan los autores.
Referencia:
Dharmendra Modha et al. “Neural inference at the frontier of energy, space, and time”. Science (octubre 2023)