NVIDIA presenta Nemotron 3 Super 120B y DGX Spark: La era de los agentes de IA locales ha llegado

NVIDIA ha presentado en el GTC 2026 las últimas novedades en computación local de IA, destacando nuevos modelos abiertos y herramientas para crear agentes de inteligencia artificial que funcionan directamente en PCs con GPUs NVIDIA RTX y la supercomputadora de escritorio DGX Spark.

NVIDIA RTX AI Garage Nemotron 3

El concepto de «Agent Computers»

La computación personal está evolucionando más allá de PCs, smartphones y tablets. La IA generativa ha introducido una nueva categoría: agent computers. Estos dispositivos están diseñados específicamente para ejecutar agentes de IA de forma privada y gratuita.

Dispositivos ideales:

  • NVIDIA DGX Spark: Supercomputadora de escritorio con 128GB de memoria unificada
  • PCs con NVIDIA RTX: GPUs con capacidad de ejecutar modelos localmente

Nuevos modelos abiertos

NVIDIA RTX PRO Server

NVIDIA Nemotron 3 Super 120B

  • 120 mil millones de parámetros totales
  • 12 mil millones de parámetros activos
  • Diseñado para sistemas de agentes complejos
  • Funciona en DGX Spark y estaciones de trabajo RTX PRO
  • Puntuación PinchBench: 85.6% (mejor modelo abierto de su clase)

Mistral Small 4

  • 119 mil millones de parámetros totales
  • 6 mil millones de parámetros activos
  • Optimizado para chat general, programación y tareas agenticas

NVIDIA Nemotron 3 Nano 4B

  • 4 mil millones de parámetros (modelo compacto)
  • Ideal para PCs GeForce RTX
  • Perfecto para crear asistentes conversacionales en juegos y apps

Ventanas de contexto masivas

La próxima generación de modelos locales incluye ventanas de contexto cada vez más grandes, permitiendo:

  • Mantener conversaciones largas sin perder el hilo
  • Procesar documentos extensos
  • Contexto de usuario más rico para respuestas personalizadas

La DGX Spark con sus 128GB de memoria unificada soporta modelos de más de 120 mil millones de parámetros localmente.

GTC 2026 Keynote NVIDIA

NVIDIA NemoClaw

NVIDIA presenta NemoClaw, un stack de código abierto para OpenClaw que optimiza las experiencias en dispositivos NVIDIA:

  • Mayor seguridad al ejecutar modelos localmente
  • Soporte para modelos locales sin conexión a la nube
  • Optimización específica para hardware NVIDIA

Fine-tuning con Unsloth Studio

NVIDIA integra Unsloth Studio para facilitar el fine-tuning de modelos:

  • Mejora la precisión de modelos abiertos
  • Flujos de trabajo agenticos optimizados
  • Sin necesidad de infraestructura de nube costosa

Conclusión

Con los nuevos modelos Nemotron 3, DGX Spark y las herramientas de desarrollo, NVIDIA está democratizando el acceso a agentes de IA avanzados que funcionan localmente. Los usuarios pueden ahora ejecutar modelos de más de 120 mil millones de parámetros en sus propios dispositivos, manteniendo la privacidad y sin costes de suscripción a servicios en la nube.


Fuente: NVIDIA Official – RTX AI Garage

Nota: Las imágenes pertenecen a NVIDIA Corporation. Se utilizan con fines informativos y de difusión de noticias tecnológicas.

Scroll al inicio