NVIDIA propose désormais un accès gratuit aux API accélérées par GPU pour Kimi K2.5, un modèle d'IA multimodal de 1T paramètres avec 384 experts et une longueur de contexte de 262K pour les développeurs. (ReadNVIDIA propose désormais un accès gratuit aux API accélérées par GPU pour Kimi K2.5, un modèle d'IA multimodal de 1T paramètres avec 384 experts et une longueur de contexte de 262K pour les développeurs. (Read

NVIDIA lance des points de terminaison accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

Temps de lecture : 3 min

NVIDIA lance des endpoints accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

Jessie A Ellis 04 fév. 2026 21:11

NVIDIA offre désormais un accès API gratuit accéléré par GPU à Kimi K2.5, un modèle d'IA multimodal de 1T paramètres avec 384 experts et une longueur de contexte de 262K pour les développeurs.

NVIDIA lance des endpoints accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

NVIDIA a déployé des endpoints accélérés par GPU pour Kimi K2.5 de Moonshot AI, offrant aux développeurs un accès API gratuit à l'un des modèles multimodaux open-source les plus performants actuellement disponibles. L'intégration, annoncée le 4 février 2026, positionne ce modèle de 1 trillion de paramètres pour une adoption rapide en entreprise via la plateforme build.nvidia.com de NVIDIA.

Kimi K2.5 regroupe des spécifications techniques sérieuses qui comptent pour les déploiements en production. Le modèle utilise une architecture Mixture-of-Experts avec 384 experts, activant seulement 32,86 milliards de paramètres par token—un taux d'activation de 3,2% qui maintient les coûts d'inférence gérables malgré le nombre massif de paramètres. La longueur de contexte s'étend à 262 000 tokens, gérant une analyse substantielle de documents et des conversations prolongées.

Les capacités de vision méritent attention. Moonshot a construit une MoonViT3d Vision Tower personnalisée qui traite les images et les trames vidéo en embeddings, soutenue par un vocabulaire de 164 000 tokens contenant des tokens spécifiques à la vision. Ce n'est pas une multimodalité ajoutée—c'est natif à l'architecture.

Ce que les développeurs obtiennent

L'accès gratuit au prototypage via le Developer Program de NVIDIA permet aux équipes de tester contre les charges de travail de production avant d'engager l'infrastructure. L'API suit des modèles compatibles OpenAI, incluant la prise en charge des appels d'outils pour les workflows agentiques. Les microservices NVIDIA NIM pour l'inférence de production conteneurisée arrivent, bien qu'aucun calendrier spécifique n'ait été fourni.

Pour les déploiements auto-hébergés, l'intégration vLLM est prête maintenant. NVIDIA a également confirmé la prise en charge du fine-tuning via le NeMo Framework open-source, utilisant NeMo AutoModel pour personnaliser le modèle directement à partir des checkpoints Hugging Face sans étapes de conversion.

Contexte du marché

Moonshot AI a publié Kimi K2.5 le 27 janvier 2026, en l'entraînant sur environ 15 trillions de tokens mixtes visuels et textuels construits au-dessus de la fondation K2 antérieure. Le modèle a suscité des comparaisons directes avec Gemini 3 Pro de Google, affichant des benchmarks compétitifs incluant un score de 78,5% aux tests de compréhension visuelle MMMU-Pro et 76,8% sur SWE-Bench Verified pour les tâches de codage.

Une fonctionnalité différenciante : le mécanisme "Agent Swarm" qui coordonne jusqu'à 100 sous-agents parallèles, réduisant le temps d'exécution de 4,5x par rapport aux approches à agent unique. Pour les entreprises construisant des systèmes autonomes complexes, c'est un écart de capacité significatif.

Le support de l'architecture Blackwell de NVIDIA suggère que l'entreprise voit Kimi K2.5 comme un concurrent sérieux dans les déploiements d'IA en entreprise. Les développeurs peuvent accéder au modèle immédiatement via build.nvidia.com ou via la plateforme Kimi API directement depuis Moonshot.

Source de l'image : Shutterstock
  • nvidia
  • kimi k2.5
  • moonshot ai
  • ia multimodale
  • calcul gpu
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter service@support.mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.