アリババグループホールディングリミテッドはAIインフラの大きなブレークスルーを受け、1.19%上昇の167.05ドルで取引を終えました。
アリババグループホールディングリミテッド、BABA
同社はモデル提供オペレーションでNvidia GPUの使用量を82%削減するコンピューティングプーリングソリューションを導入しました。この進歩により、アリババクラウドは大規模なAI展開の最適化競争で先頭に立っています。
杭州を拠点とする企業のクラウドコンピューティング部門であるアリババクラウドは、AI効率を高めるためにAegaeonと呼ばれる新システムを実装しました。このソリューションにより、1台のNvidia H20 GPUで最大7つの大規模言語モデルを同時に処理できるようになりました。この変更により、社内テスト中のGPU使用量が1,192ユニットからわずか213ユニットに削減されました。
Aegaeonは、並行AIワークロード間でモデル推論中にトークンレベルで自動スケールを実行することで機能します。この戦略により動的なリソース再割り当てが可能になり、同じGPUが処理中にモデル間を切り替えられるようになります。また、モデル切り替えタスクの遅延も97%削減しました。
このソリューションは、アリババクラウドの百連マーケットプレイスで3ヶ月以上ベータテストされました。サービス低下なしに最大720億パラメータを持つ数十のモデルを処理しました。Aegaeonは現在、同社独自のQwenモデルを提供するアリババのモデルマーケットプレイスに正式に導入されています。
アリババクラウドは、実際のAIタスクで頻繁に使用されるモデルはごく少数であることを発見しました。それにもかかわらず、多くのGPUがめったに呼び出されないモデルに割り当てられ、リソース使用率が低くなっていました。データによると、GPUの17.7%が全推論リクエストのわずか1.35%にしか対応していませんでした。
Aegaeonにより、同社はプーリングとスマートスケーリング戦略を通じてこの不均衡を解決しました。このシステムは一貫したGPU使用を確保し、ほとんど使用されないモデル全体でのアイドル処理を防止しました。アリババは企業導入向けに高いスループットとハードウェア効率の向上を実現しました。
北京大学とアリババクラウドの研究者らは、この革新について詳述した技術論文を共同執筆し、韓国のSOSP 2025で発表しました。この研究は、従来のGPU方法で並行ワークロードを処理すると不必要なコストが発生することを強調しました。このブレークスルーは、リソース制約下での中国のAIインフラ近代化の目標を直接サポートしています。
NVIDIAは米国の輸出規制に準拠し、中国でのAI推論専用にH20 GPUを開発しました。しかし、中国の規制当局は最近、チップの潜在的なバックドアセキュリティ脆弱性について調査を開始しました。この精査により、中国内でのチップの市場ポジションと採用に影響が出ています。
ファーウェイやカンブリコンなどの中国企業は、外国依存を減らすために国産GPUの開発を加速しています。NVIDIAのCEOは、同社の中国における先進AIチップの市場シェアがゼロになったと述べています。この傾向は、地元プレーヤーにイノベーションとAIハードウェアサプライチェーンのローカライズを促しています。
アリババの新しいアプローチは、技術的自給自足のための国家戦略に沿いながら、市場での立場を強化しています。米国チップへの依存を減らすことで、アリババは中国の進化するAIエコシステムでより強固な足場を獲得しています。株価の上昇は、同社の技術主導のコスト削減とスケーラビリティへの信頼を反映しています。
アリババグループホールディングリミテッド(BABA)の株価は、新しいAIプーリング技術がNvidia GPUの使用を82%削減したことで急上昇したという記事が最初にCoinCentralに掲載されました。

