El modelo Nemotron 3 Super de 120B parámetros de NVIDIA ya está disponible en Together AI, ofreciendo ganancias de rendimiento de 5x para sistemas de IA multiagente y cargas de trabajo empresariales. (El modelo Nemotron 3 Super de 120B parámetros de NVIDIA ya está disponible en Together AI, ofreciendo ganancias de rendimiento de 5x para sistemas de IA multiagente y cargas de trabajo empresariales. (

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M tokens

2026/03/12 05:43
Lectura de 3 min
Si tienes comentarios o inquietudes sobre este contenido, comunícate con nosotros mediante crypto.news@mexc.com
```html

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M de tokens

Jessie A Ellis 11 de marzo de 2026 21:43

El modelo Nemotron 3 Super de NVIDIA con 120B parámetros ya está disponible en Together AI, ofreciendo ganancias de rendimiento de 5x para sistemas de IA multi-agente y cargas de trabajo empresariales.

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M de tokens

Together AI anunció el 11 de marzo la disponibilidad de Nemotron 3 Super de NVIDIA en su plataforma Dedicated Inference, brindando a los desarrolladores empresariales acceso a un modelo de razonamiento de 120 mil millones de parámetros optimizado para sistemas de IA multi-agente. Las acciones de NVIDIA cotizaron a $186.03, con un aumento del 0.66% tras la noticia.

El momento importa. Nemotron 3 Super representa el segundo modelo de pesos abiertos de NVIDIA en la familia Nemotron 3, tras el lanzamiento de Nano en diciembre, y apunta a un punto crítico específico en la IA de producción: la sobrecarga computacional de ejecutar flujos de trabajo de agentes complejos a escala.

Por qué importa la arquitectura

Esto es lo que hace que este modelo sea diferente de la típica carrera armamentística de conteo de parámetros. A pesar de sus 120B parámetros totales, solo 12B están activos durante la inferencia. El diseño híbrido—que combina atención Transformer con procesamiento de secuencias Mamba—ofrece lo que NVIDIA afirma es un rendimiento 5x mayor que el modelo Nemotron Super anterior.

La ventana de contexto de 1 millón de tokens aborda lo que los desarrolladores llaman "explosión de contexto". Las aplicaciones multi-agente pueden consumir 15x más tokens que las interacciones de chat estándar, y la mayoría de los modelos se atascan con esa carga. Nemotron 3 Super maneja bases de código completas, almacenes de documentos extensos y trayectorias de agentes prolongadas sin la caída de rendimiento.

El entrenamiento Multi-Token Prediction permite al modelo generar varios tokens simultáneamente por pase hacia adelante. Para generación de código o salidas estructuradas, NVIDIA reporta generación de tokens 50% más rápida en comparación con los principales modelos abiertos.

La jugada de Together AI

Ejecutar un modelo híbrido de 120B con contexto de millón de tokens típicamente demanda computación distribuida a través de múltiples nodos. La oferta Dedicated Inference de Together AI simplifica el despliegue a GPUs NVIDIA H200 o H100 individuales—sin aprovisionamiento de GPU requerido del lado del desarrollador.

La plataforma promete un SLA de disponibilidad del 99.9% y cumplimiento SOC 2, posicionando esto como infraestructura lista para empresas en lugar de experimentación de grado de investigación.

Aplicaciones de producción

Los casos de uso objetivo incluyen asistentes de desarrollador que analizan bases de código, sistemas de procesamiento de documentos empresariales, clasificación de vulnerabilidades de ciberseguridad y capas de orquestación que enrutan tareas a través de agentes especializados.

El enfoque de pesos abiertos—lanzado bajo la Licencia de Modelo Abierto Nemotron de NVIDIA—permite a los equipos ajustar para entornos específicos y desplegar en las instalaciones, una consideración crítica para empresas con requisitos de soberanía de datos.

NVIDIA también anunció NemoClaw el 10 de marzo, una plataforma de código abierto para agentes de IA que podría complementar los despliegues de Nemotron 3 Super. Los desarrolladores pueden acceder al modelo a través del nivel de inferencia dedicado de Together AI de inmediato.

Fuente de la imagen: Shutterstock
  • nvidia
  • infraestructura de IA
  • nemotron
  • together ai
  • IA empresarial
```
Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección crypto.news@mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.