NVIDIA lance des endpoints accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

Jessie A Ellis 04 fév. 2026 21:11

NVIDIA offre désormais un accès API gratuit accéléré par GPU à Kimi K2.5, un modèle d'IA multimodal de 1T paramètres avec 384 experts et une longueur de contexte de 262K pour les développeurs.

NVIDIA lance des endpoints accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

NVIDIA a déployé des endpoints accélérés par GPU pour Kimi K2.5 de Moonshot AI, offrant aux développeurs un accès API gratuit à l'un des modèles multimodaux open-source les plus performants actuellement disponibles. L'intégration, annoncée le 4 février 2026, positionne ce modèle de 1 trillion de paramètres pour une adoption rapide en entreprise via la plateforme build.nvidia.com de NVIDIA.

Kimi K2.5 regroupe des spécifications techniques sérieuses qui comptent pour les déploiements en production. Le modèle utilise une architecture Mixture-of-Experts avec 384 experts, activant seulement 32,86 milliards de paramètres par token—un taux d'activation de 3,2% qui maintient les coûts d'inférence gérables malgré le nombre massif de paramètres. La longueur de contexte s'étend à 262 000 tokens, gérant une analyse substantielle de documents et des conversations prolongées.

Les capacités de vision méritent attention. Moonshot a construit une MoonViT3d Vision Tower personnalisée qui traite les images et les trames vidéo en embeddings, soutenue par un vocabulaire de 164 000 tokens contenant des tokens spécifiques à la vision. Ce n'est pas une multimodalité ajoutée—c'est natif à l'architecture.

Ce que les développeurs obtiennent

L'accès gratuit au prototypage via le Developer Program de NVIDIA permet aux équipes de tester contre les charges de travail de production avant d'engager l'infrastructure. L'API suit des modèles compatibles OpenAI, incluant la prise en charge des appels d'outils pour les workflows agentiques. Les microservices NVIDIA NIM pour l'inférence de production conteneurisée arrivent, bien qu'aucun calendrier spécifique n'ait été fourni.

Pour les déploiements auto-hébergés, l'intégration vLLM est prête maintenant. NVIDIA a également confirmé la prise en charge du fine-tuning via le NeMo Framework open-source, utilisant NeMo AutoModel pour personnaliser le modèle directement à partir des checkpoints Hugging Face sans étapes de conversion.

Contexte du marché

Moonshot AI a publié Kimi K2.5 le 27 janvier 2026, en l'entraînant sur environ 15 trillions de tokens mixtes visuels et textuels construits au-dessus de la fondation K2 antérieure. Le modèle a suscité des comparaisons directes avec Gemini 3 Pro de Google, affichant des benchmarks compétitifs incluant un score de 78,5% aux tests de compréhension visuelle MMMU-Pro et 76,8% sur SWE-Bench Verified pour les tâches de codage.

Une fonctionnalité différenciante : le mécanisme "Agent Swarm" qui coordonne jusqu'à 100 sous-agents parallèles, réduisant le temps d'exécution de 4,5x par rapport aux approches à agent unique. Pour les entreprises construisant des systèmes autonomes complexes, c'est un écart de capacité significatif.

Le support de l'architecture Blackwell de NVIDIA suggère que l'entreprise voit Kimi K2.5 comme un concurrent sérieux dans les déploiements d'IA en entreprise. Les développeurs peuvent accéder au modèle immédiatement via build.nvidia.com ou via la plateforme Kimi API directement depuis Moonshot.

Source de l'image : Shutterstock

nvidia
kimi k2.5
moonshot ai
ia multimodale
calcul gpu

NVIDIA lance des points de terminaison accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

NVIDIA lance des endpoints accélérés par GPU pour le modèle Kimi K2.5 de Moonshot AI

Ce que les développeurs obtiennent

Contexte du marché

Vous aimerez peut-être aussi

BNB Chain déploie la norme d'identité ERC-8004 sur BSC

VidMate No Ads : Votre solution sans publicité pour des téléchargements vidéo fluides

Actions américaines mitigées : le gain résilient du Dow défie le déclin du marché mené par la tech

Actualités tendance

BNB Chain déploie la norme d'identité ERC-8004 sur BSC

VidMate No Ads : Votre solution sans publicité pour des téléchargements vidéo fluides

Actions américaines mitigées : le gain résilient du Dow défie le déclin du marché mené par la tech

Alerte rallye Chainlink : LINK pourrait atteindre 12–14 $ suite à l'accord GAKS

Le Meilleur Investissement Crypto À Faire Aujourd'hui Est Pepeto, Meilleur Que Shiba Inu Et Pepe

Prix des cryptomonnaies