La empresa Nvidia está jugando fuerte en el mundo IA con su hardware de última generación, pero ahora también se suma al software con NVLM. Competirá con GPT-4o y Llama a través de un LLM de código abierto para sumarse a los modelos multimodales (imagen, texto).
Nvidia domina el sector del hardware para IA con sus GPUs para centralizar datos, con los modelos H100 y B200 como los más representativos. Pero con NVLM llega una nueva apuesta para el sector de los grandes modelos de lenguaje (LLM por sus siglas en inglés). La propuesta de Nvidia viene a dar pelea en un sector dominado por OpenAI y su GPT-4º. Sin embargo hay otros competidores también, como Gemini de Google, Llama de Meta y Claude 3.5 de Anhtropic.
¿Qué propone NVLM de Nvidia para revolucionar el mundo de las IA?
NVLM 1.0 de Nvidia es el nuevo competidor en el mundo de los grandes modelos de lenguaje para IA. Los desarrolladores publicaron un estudio en el que se detalla cómo funciona y qué permitirá esta nueva propuesta que apunta a competir en el segmento del software con IA.
En pocas palabras, NVLM es toda una familia de LLMs multimodales que, según Nvidia, brinda resultados destacables en visión y lenguaje. EL estudio indica una capacidad de análisis y desarrollo muy similar a la de otros modelos ya popularizados, como GPT-4o.
En NVLM encontramos un modelo con 72.000 millones de parámetros, el número más ambicioso y capaz hasta la fecha. De acuerdo a Nvidia, su comportamiento y tipo de respuestas es mejor que el de Llama 3 405B, un modelo mucho mayor según las pruebas de rendimiento.
Otra de las ventajas de la propuesta de Nvidia es que NVLM ofrece un modelo de IA de código abierto de pesos abiertos. Sus responsables prometen publicar el código que se usa para entrenar al modelo, algo extremadamente útil. Los desarrolladores podrán utilizarlo en sus propios proyectos y ‘forks’.
¿Qué ofrecerá NVLM al mundo IA?
Con NVLM se podrán analizar entradas visuales y de texto. Esto se traduce en la capacidad de la IA para interpretar memes y analizar fotografías. A la pasada, también podrás usar este modelo de lenguaje creado por Nvidia para resolver problemas matemáticos paso a paso.
El funcionamiento de este sistema combina OCR, localización, sentido común, conocimientos del mundo y capacidades de programación. Todo eso en conjunto, le permite a NVLM responder diferentes solicitudes y situaciones con una gran versatilidad. Explorar los alcances de este nuevo modelo de lenguaje IA, y su comparativa en rendimiento con otros actores del sector permite comprender hacia donde avanza la tecnología.
Sobre el preentrenamiento
Los responsables del entrenamiento de NVLM han emplead una arquitectura mejorada para el entrenamiento y razonamiento de su modelo. Sus capacidades son muy versátiles y es capaz de procesar 72.000 millones de parámetros y rivalizar directamente con GPT-4o, Llama 3-V-70B y Gemini 1.5 Pro. Su mayor rendimiento actualmente está probado en la resolución de problemas matemáticos, procesamiento de imágenes y de texto.
La información utilizada para el preentrenamiento y capacitación fue minuciosamente seleccionada con ajustes finos y supervisión humana. El trabajo sirvió para comprobar la calidad de los conjuntos de datos así como la diversidad de tareas compatibles y en escala, inclusive durante la etapa de aprendizaje previo.
El poderoso algoritmo creado por Nvidia fue lanzado como código abierto, junto al modelo con instrucciones y parámetros de entrenamiento. Se pueden usar y modificar sin costo alguno, distribuidos a través de Megatron-Core, la biblioteca de desarrollo de la firma.
Se trata de un verdadero hito en la industria, porque Nvidia está facilitando que otras organizaciones pequeñas o investigadores independientes también contribuyan al avance de la IA. El libre a la herramienta y sus características similares a las de otros productos de las big tech marcará un antes y un después en la carrera de control del sector.
Con este nuevo LLM se apunta a ampliar la base de s y clientes, favoreciendo un negocio que ya de por sí es lucrativo. Pero que ahora sumará todavía más entusiastas y potenciales s alrededor del mundo. Un excelente paso para Nvidia que además de dominar el sector de la IA mediante hardware, ahora apunta al sector del software de manera directa.
Estrategia empresarial híbrida
La posición protagónica que ha tomado Nvidia en el sector tecnológico y en el desarrollo de Inteligencia Artificial responde a estrategia empresarial de tipo híbrido. Por un lado contempla el desarrollo y la producción de chips y la venta de sistemas avanzados para promover el funcionamiento de algoritmos muy diversos. Así se aceleró la generación de ingresos y se obtuvo el beneplácito de los inversores. Por otro, se trabaja en los algoritmos de IA para que Nvidia se posicione en un segmento donde corre con desventaja frente a OpenAI, Google y Meta. Pero gracias a esta estrategia, NVLM está demostrando ser una gran herramienta, capaz de pelear cara a cara con gigantes de la IA que ya están posicionados.
Con los nuevos procesadores de Nvidia, la velocidad y capacidad de análisis y resolución de problemas matemáticos que alcanzan los s es notable. La llegada de NVLM 1.0 marcará un antes y un después para el sector, generando la posibilidad de un nuevo actor con propuestas Open Source para llegar a mayor cantidad de s y empresas pequeñas y medianas.
¿Cómo será la situación del mercado IA ahora que entró Nvidia con NVLM?
Hasta ahora, Nvidia ofrecía los procesadores y GPUs más importantes para todo tipo de centros de datos y servidores donde se ejecutan modelos IA. Pero NVLM implica el desembarco directo de Nvidia en el sector, y esto puede generar algunas fricciones con el resto de la competencia. La iniciativa de código abierto y el ambicioso poder de procesamiento hacen que NVLM sea un modelo de lenguaje muy atractivo. Resta ver cómo se adapta y los usos que la comunidad de s empiezan a darle para terminar de entender sus alcances. Probablemente empecemos a escuchar importantes novedades del sector IA ahora que entró a jugar Nvidia.