イーロン・マスクのAIスタートアップであるxAIが、「ワールドモデル」として知られる次世代AIシステムの開発に向けた取り組みを強化していると報じられています。
これらの高度なシステムは、AIが物理的環境を理解し、設計し、対話することを支援することを目的としており、OpenAIのChatGPTやxAI自身のチャットボットGrokなどの既存の大規模言語モデルの能力を大きく超える飛躍です。
関係者によると、xAIはNvidiaのトップ研究者であるZeeshan PatelとEthan Heを採用しました。彼らは両方とも、ビデオとロボティクスデータを使用したAIシステムのトレーニングに深い経験を持っています。彼らの専門知識は、テキストを処理するだけでなく、リアルタイムで現実世界を認識し応答するAIを作成するというMuskの野望と一致しています。
この新しい方向性により、xAIはOpenAIやGoogle DeepMindなどの技術大手と真っ向から競争することになります。これらの企業もまた、AIが3D環境やマルチモーダルデータからどのように学習できるか、テキスト、画像、ビデオ、物理シミュレーションを一貫した理解に統合する方法を探求しています。
ワールドモデルという用語は、行動がどのように展開するかを予測するために物理的世界をシミュレートするAIシステムを指し、ロボティクス、自律走行車、現実を操縦できるインテリジェントエージェントの不可欠な基盤です。
PatelとHeが以前働いていたNvidiaは、OmniverseとIsaac Simプラットフォームを持ち、このフィールドの最前線にいます。これらはデジタル環境でロボットをトレーニングしテストするためのシミュレーションツールです。Nvidiaのシミュレーション技術を活用することで、xAIはバーチャル空間で現実世界の学習の複雑さを再現し、ロボティクスやリアルタイムAIシステムの開発を潜在的に加速させることを望んでいます。
このビジョンに沿って、xAIは「Omniチーム」と呼ばれるものを結成しました。これは画像、ビデオ、オーディオ形式でコンテンツを処理・生成できるAIモデルに取り組む専門ユニットです。この動きは、見て、聞いて、行動できるAIシステムを構築し、デジタルインテリジェンスと現実世界の能力のギャップを埋めたいというMuskの願望を示しています。
大胆な野望にもかかわらず、xAIは重大な障害に直面しています。最大の課題の一つは計算能力、つまり大規模モデルをトレーニングするために必要な生のハードウェアパワーです。
同社は、タイミングとエネルギー供給に関する意見の相違により、提案された100億ドルのクラウドインフラ契約についてOracleとの協議を終了したと報じられています。代わりに、xAIは現在、Nvidia H100 GPUを使用した独自のAI計算クラスターの構築に取り組んでいます。これは今日の最先端AIシステムのほとんどを動かしているのと同じチップです。
しかし、業界リーダーと比較すると、xAIの計算リソースは限られたままです。OpenAIは今年末までに100万以上のGPUがオンラインになると述べており、ByteDanceなどの他の企業も同様の大規模AIトレーニングのためにGPUクラスターを積極的に拡大しています。xAIにとって、追いつくには才能だけでなく、大規模なインフラ投資も必要となるでしょう。
記事「xAI、次世代「ワールドモデル」プラットフォーム開発のためにNvidiaエンジニアを採用」はCoinCentralで最初に公開されました。


