中国を拠点とするAIスタートアップDeepSeekは、長文コンテキストタスクの推論コストを半分近く削減するよう設計された最新の実験的言語モデルV3.2-expを発表しました。
月曜日に発表されたこのモデルは、大規模AI導入における最も差し迫った課題の一つである長い入力処理のコストに対処することを目指しています。
V3.2-expは、「lightning indexer」と細かいトークン選択のためのセカンダリモジュールを組み合わせたDeepSeek Sparse Attentionと呼ばれる新システムを活用しています。
これらの革新により、モデルは最も関連性の高い部分に焦点を当てながら、トークンレベルの詳細を精密に管理できます。初期の社内テストでは、このシステムがサーバー負荷を大幅に削減し、長文コンテキスト操作のAPIコストが50%削減される可能性があることが示されています。
クローズドなままの多くの商用AIリリースとは異なり、V3.2-expはオープンウェイトモデルとしてリリースされました。現在Hugging Faceでアクセス可能となり、研究者、開発者、企業が独自の評価を実行する機会を提供しています。
この決定は、特に企業が効率性とパフォーマンスに関する主張を精査する中で、DeepSeekの透明性とコラボレーションへの継続的な取り組みを強調しています。
このモデルのオープンリリースは、今年初めのR1モデルでのDeepSeekの以前の戦略とも一致しており、オープンベンチマークによりコミュニティがその推論能力を検証することができました。V3.2-expでも同じアプローチを採用することで、DeepSeekは効率性のブレークスルーに自信を示しています。
V3.2-expの発表は、DeepSeekが最近数ヶ月間に行った一連のアップデートと実験の後に行われました。今年9月初め、同社はAIエージェントのパフォーマンス向上と、判読不能な記号や一貫性のない言語切り替えなどの報告された問題に対処することを目的とした改良版DeepSeek-V3.1-Terminusを導入しました。
そのアップデートはHumanity's Last Examやコーディングタスクなどのベンチマークで小さな改善をもたらしましたが、特に中国語のパフォーマンスにおいて一部の課題が残りました。
一方、業界レポートによると、DeepSeekは2025年第4四半期に発表予定の次世代エージェント重視モデルに取り組んでいることが明らかになっています。このプロジェクトは、最小限の人間の監督で複数ステップのタスクを実行できる自律型AIシステムへの業界全体のシフトを反映しています。V3.2-expのリリースは、より高度なエージェント機能が展開される前に、効率性における同社の技術基盤を強化することでこの軌道を補完するものと思われます。
DeepSeekのイノベーションは、中国のAIセクターでの競争が激化している時期に登場しています。アリババやテンセントなどのライバル企業はAI投資を劇的に拡大しており、アリババはクラウドとAIインフラに3800億人民元(529億ドル)以上を投じることを約束しています。
DeepSeekは比較的控えめなリソースで費用対効果の高い結果を達成したことで称賛されていますが、アナリストは、資金力のあるライバルに埋もれないようにするためには勢いを維持する必要があると警告しています。
この記事「New DeepSeek Model Halves API Costs for Extended Contexts」は最初にCoinCentralに掲載されました。


