NVIDIA libera Nemotron 3 Nano Omni, un modelo abierto que unifica visión, audio y lenguaje
NVIDIA publica Nemotron 3 Nano Omni, un modelo de razonamiento omni-modal y de pesos abiertos que combina visión, audio y texto en un único sistema compacto.
NVIDIA ha liberado Nemotron 3 Nano Omni, un modelo de razonamiento omni-modal y de pesos abiertos que unifica en un solo sistema visión, audio y lenguaje. «Nano» alude a su tamaño contenido, pensado para ejecutarse de forma eficiente, y «omni» a su capacidad de procesar varias modalidades a la vez.
El movimiento es estratégico: NVIDIA no solo vende las GPUs sobre las que corre la IA, sino que ahora regala modelos abiertos que empujan la demanda de esas mismas GPUs. Un modelo compacto y multimodal que cualquiera puede descargar y ajustar amplía el ecosistema y refuerza su posición en toda la pila, del silicio al software.
La apuesta por lo abierto contrasta con la lógica cerrada de OpenAI o Anthropic. Los pesos abiertos permiten a empresas y desarrolladores ejecutar el modelo en su propia infraestructura, ajustarlo y auditarlo, algo cada vez más valorado en entornos sensibles a la privacidad y la dependencia.
Que el mayor vendedor de GPUs regale modelos abiertos no es generosidad, es estrategia de plataforma: cada modelo que se descarga acaba consumiendo silicio de NVIDIA. La señal real es la consolidación de dos caminos divergentes —el cerrado de los grandes laboratorios y el abierto que empujan NVIDIA y la comunidad—, y que la multimodalidad real (ver, oír y leer a la vez) ya no es exclusiva de los modelos de pago. El riesgo del código abierto es la seguridad: un modelo que cualquiera puede ajustar también puede desalinearse sin control. Pero la dirección es clara: la capacidad se democratiza, y quien controle la capa de hardware ganará gane quien gane la de los modelos.