NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M de tokens

Jessie A Ellis 11 de marzo de 2026 21:43

El modelo Nemotron 3 Super de NVIDIA con 120B parámetros ya está disponible en Together AI, ofreciendo ganancias de rendimiento de 5x para sistemas de IA multi-agente y cargas de trabajo empresariales.

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M de tokens

Together AI anunció el 11 de marzo la disponibilidad de Nemotron 3 Super de NVIDIA en su plataforma Dedicated Inference, brindando a los desarrolladores empresariales acceso a un modelo de razonamiento de 120 mil millones de parámetros optimizado para sistemas de IA multi-agente. Las acciones de NVIDIA cotizaron a $186.03, con un aumento del 0.66% tras la noticia.

El momento importa. Nemotron 3 Super representa el segundo modelo de pesos abiertos de NVIDIA en la familia Nemotron 3, tras el lanzamiento de Nano en diciembre, y apunta a un punto crítico específico en la IA de producción: la sobrecarga computacional de ejecutar flujos de trabajo de agentes complejos a escala.

Por qué importa la arquitectura

Esto es lo que hace que este modelo sea diferente de la típica carrera armamentística de conteo de parámetros. A pesar de sus 120B parámetros totales, solo 12B están activos durante la inferencia. El diseño híbrido—que combina atención Transformer con procesamiento de secuencias Mamba—ofrece lo que NVIDIA afirma es un rendimiento 5x mayor que el modelo Nemotron Super anterior.

La ventana de contexto de 1 millón de tokens aborda lo que los desarrolladores llaman "explosión de contexto". Las aplicaciones multi-agente pueden consumir 15x más tokens que las interacciones de chat estándar, y la mayoría de los modelos se atascan con esa carga. Nemotron 3 Super maneja bases de código completas, almacenes de documentos extensos y trayectorias de agentes prolongadas sin la caída de rendimiento.

El entrenamiento Multi-Token Prediction permite al modelo generar varios tokens simultáneamente por pase hacia adelante. Para generación de código o salidas estructuradas, NVIDIA reporta generación de tokens 50% más rápida en comparación con los principales modelos abiertos.

La jugada de Together AI

Ejecutar un modelo híbrido de 120B con contexto de millón de tokens típicamente demanda computación distribuida a través de múltiples nodos. La oferta Dedicated Inference de Together AI simplifica el despliegue a GPUs NVIDIA H200 o H100 individuales—sin aprovisionamiento de GPU requerido del lado del desarrollador.

La plataforma promete un SLA de disponibilidad del 99.9% y cumplimiento SOC 2, posicionando esto como infraestructura lista para empresas en lugar de experimentación de grado de investigación.

Aplicaciones de producción

Los casos de uso objetivo incluyen asistentes de desarrollador que analizan bases de código, sistemas de procesamiento de documentos empresariales, clasificación de vulnerabilidades de ciberseguridad y capas de orquestación que enrutan tareas a través de agentes especializados.

El enfoque de pesos abiertos—lanzado bajo la Licencia de Modelo Abierto Nemotron de NVIDIA—permite a los equipos ajustar para entornos específicos y desplegar en las instalaciones, una consideración crítica para empresas con requisitos de soberanía de datos.

NVIDIA también anunció NemoClaw el 10 de marzo, una plataforma de código abierto para agentes de IA que podría complementar los despliegues de Nemotron 3 Super. Los desarrolladores pueden acceder al modelo a través del nivel de inferencia dedicado de Together AI de inmediato.

Fuente de la imagen: Shutterstock

nvidia
infraestructura de IA
nemotron
together ai
IA empresarial

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M tokens

NVIDIA Nemotron 3 Super llega a Together AI con ventana de contexto de 1M de tokens

Por qué importa la arquitectura

La jugada de Together AI

Aplicaciones de producción

También te puede interesar

Una vulnerabilidad en chips de MediaTek pone en riesgo las billeteras cripto, permitiendo el robo de frases semilla en solo 45 segundos.

Todos los alimentos que no se acostumbran a comer en Semana Santa

“Precio del petróleo marcará ritmo de la economía mundial”

Noticias en tendencia

Una vulnerabilidad en chips de MediaTek pone en riesgo las billeteras cripto, permitiendo el robo de frases semilla en solo 45 segundos.

Todos los alimentos que no se acostumbran a comer en Semana Santa

“Precio del petróleo marcará ritmo de la economía mundial”

Los videos del momento en el que un diputado libertario fue agredido en Tucumán

‘El Ferrari de las visas’

Precios de criptos