カーネギーメロン大学のTheAgentCompanyベンチマークが、最高のAIエージェントでも実際のオフィス業務の70%近くで失敗することを明らかにし、MITが企業向けAIエージェントパイロットプロジェクトの95%が測定可能な成果をもたらさないと報告し、ガートナーが2027年までにエージェント型AIプロジェクトの40%以上がキャンセルされると予測する中、VectorCertain LLCの創業者兼CEOであるジョセフ・P・コンロイ氏は『The AI Agent Crisis: How To Avoid The Current 70% Failure Rate & Achieve 90% Success』を出版しました。これは、これらの調査結果を企業リーダー向けの実証済み実装フレームワークに統合した初の書籍です。
現在Amazonで入手可能なこの書籍は、カーネギーメロン大学のTheAgentCompany研究に基づいた体系的な分析を提示し、AIエージェントの導入を失敗させる7つの重要な障壁を特定し、それらを克服するための12か月の実装ロードマップを提供しています。
AIエージェントの失敗危機はもはや議論の余地がありません。これは企業テクノロジーにおいて最も徹底的に文書化された失敗パターンであり、3大陸にわたる7つの機関によって独立して確認されています:
カーネギーメロン大学(TheAgentCompany、2024年〜2025年):175の実際のタスクにわたって10の主要なAIエージェントモデルをテストしました。最高のパフォーマンスを示したGoogleのGemini 2.5 Proは、タスクの30.3%しか完了できませんでした。Claude 3.7 Sonnetは26.3%を達成しました。GPT-4oはわずか8.6%しか管理できませんでした。一般的な失敗には、データの捏造、タスク完了を偽装するためのユーザー名の変更、研究者が「常識」の根本的な欠如と呼んだものが含まれていました。
MIT NANDA「The GenAI Divide」(2025年):52の組織インタビュー、153のシニアリーダー調査、300以上の公開導入の分析に基づいて、MITは企業向けAIエージェントパイロットプロジェクトの95%が測定可能な財務的リターンをもたらさないことを発見しました。
RAND Corporation(2024年〜2025年):65人の経験豊富なデータサイエンティストとエンジニアへのインタビューの後、AIプロジェクトの80%以上が失敗する—非AI ITプロジェクトの失敗率の2倍—と結論付けました。
S&P Global(2025年):企業の42%がAIイニシアチブのほとんどを放棄したことがわかりました。前年の17%から147%の前年比増加です。
ガートナー(2025年6月):2027年末までにエージェント型AIプロジェクトの40%以上がキャンセルされると予測し、数千のエージェント型AIベンダーのうち約130社のみが真のエージェント機能を提供していることを発見しました—残りは「エージェントウォッシング」です。
「現在、ほとんどのエージェント型AIプロジェクトは、初期段階の実験または概念実証であり、主に誇大宣伝に駆動され、しばしば誤用されています。これにより、組織はAIエージェントを大規模に展開する際の真のコストと複雑さを見失う可能性があります。」
— アヌシュリー・ヴァーマ、シニアディレクターアナリスト、ガートナー
『The AI Agent Crisis』は単に問題を文書化するだけではありません。コンロイ氏の25年以上にわたるミッションクリティカルなアプリケーション向けAIシステムの構築経験—EPA規制基準となったニューラルネットワーク最適化プラットフォームを含む—を活用し、この書籍は、本番環境でAIエージェントの持続的な成功を達成するための最初の包括的なフレームワークを提示しています。
この書籍の主要な貢献には、29%という低いコミュニケーション成功率から12%のナビゲーション失敗率まで、AIエージェントの失敗を引き起こす7つの重要な障壁の特定、適切に管理されたAIエージェントが73%の収益増加と702%の年間収益率を提供する方法を示す統合された投資収益率(ROI)方法論、97%のコミュニケーション成功、90%以上のナビゲーション信頼性、85%のコスト削減を達成する本番環境で検証されたアプローチ、および12か月の展開ロードマップを含む業界固有の実装プレイブックが含まれます。
「70%の失敗率はランダムではありません—予測可能です。EPA、DOE、DoDのためにAIシステムを構築した20年間で、壊滅的な失敗が従来のアプローチが完全に無視する統計的テールイベントに集中することを発見しました。この書籍は、VectorCertainが解決するために構築されたフレームワークを体系化しています。」
— ジョセフ・P・コンロイ、創業者兼CEO、VectorCertain LLC
この書籍のメッセージの緊急性は、2026年1月と2月に劇的な形で強調されました。AIエージェントセキュリティ障害のカスケードが、書籍が特定するガバナンスギャップを正確に検証したのです。
OpenClaw、160,000以上のGitHubスターと100万人以上のユーザーを持つオープンソースAIエージェントフレームワークは、2026年の最も重要なAIセキュリティインシデントの中心となりました。研究者は、150万の露出したAPI認証トークン、82か国にわたる42,900の脆弱なコントロールパネルを発見し、Bitdefender Labsは、すべてのOpenClawスキルの約17%が暗号資産を盗むマルウェアやリバースシェルを含む悪意のある動作を示したことを発見しました。
一方、OpenAIはAIエージェントにおけるプロンプトインジェクションが「完全に解決されることはないかもしれない」という率直な承認を公表し、Meta研究は、Webエージェントに対するプロンプトインジェクション攻撃が86%のケースで部分的に成功したことを発見しました。2026年2月3日、チューリング賞受賞者である吉尾良雄氏が議長を務め、30か国以上が支援する国際AI安全報告書は、AI の進歩と効果的なセーフガードの間のギャップが依然として重要な課題であると警告しました。
「エージェント型AIに何か問題が発生すると、失敗はシステム全体にカスケードします。1つのエラーの導入は、システム全体に伝播し、それを破壊する可能性があります。」
— ジェフ・ポラード、プリンシパルアナリスト、フォレスター
これらは仮説的なリスクではありません。これらは、『The AI Agent Crisis』が対処するために書かれたガバナンス障害の現実世界の現れです。
書籍が診断フレームワークを提供する一方で、VectorCertainは立ち止まっていません。同社は、書籍の原則を本番グレードのインフラストラクチャに変換するオープンコアAIエージェントセキュリティプラットフォームであるSecureAgentのローンチを準備しています。
7,229の自動テストでゼロテスト失敗で22回連続の開発スプリントを通じて構築されたSecureAgentは、これまでに構築された最も厳密に検証されたエンタープライズソフトウェアプラットフォームの1つを表しています。このプラットフォームは、615のソースモジュール、91,849行の本番コード、123,573行のテストコードを包含しており、テストとソースの比率は1.34:1で、業界ベンチマークを上回っています。
SecureAgentのアーキテクチャは、書籍で特定されたすべての失敗モードに直接対処します。これには、4つの検証層を持つ特許取得済みの多層ガバナンスエンジン、実行前にすべてのAIエージェントアクションを検査する双方向セキュリティエンベロープ、97%以上の精度を達成するアンサンブルアーキテクチャを使用したマルチモデルコンセンサス検証、完全な規制コンプライアンスのための暗号化監査証跡、およびエンタープライズグレードのSSO、SLA実施、ロールベースのアクセス制御が含まれます。
「価値は孤立したエージェントの起動からは得られません。2026年は、堅牢な制御システムによってエンドツーエンドで管理されるオーケストレーションされたスーパーエージェントエコシステムを見始める年になるでしょう。」
— スワミ・チャンドラセカラン、グローバルヘッド、AI and Data Labs、KPMG(2026年1月)
SecureAgentは、その堅牢な制御システムになるように設計されています。可用性、価格設定、早期アクセスの詳細は、vectorcertain.comで今後数週間以内に発表されます。
エンタープライズ市場は、AIエージェントガバナンスの需要について明確に語っています。シスコは、約4億ドルでAI安全企業Robust Intelligenceを買収し、2026年2月にAI Defenseプロダクトラインを拡大しました。F5 Networksは、1億8,000万ドルでCalypsoAIを買収し、F5 AI Guardrailsをローンチしました。WitnessAIは、AIエージェントセキュリティ専用に2026年1月に5,800万ドルを調達しました。そして、2025年に834%の収益成長を達成したGalileo AIは、専用のAgent Reliability Platformをローンチしました。
ガートナーは、2026年末までにエンタープライズアプリケーションの40%がタスク固有のAIエージェントを統合すると予測しています—2025年の5%未満から増加します。しかし、デロイトの2026年State of AI調査では、エンタープライズの21%のみがエージェントガバナンスの成熟したモデルを持っていることがわかりました。その展開速度とガバナンス準備の間のギャップこそが、VectorCertainがサービスを提供するために構築された正確な市場です。
EU AI法の高リスクAIシステム要件の完全施行は、2026年8月2日に開始され、最大3,500万ユーロまたはグローバル収益の7%の罰則が科せられます。米国では、38州が2025年にAI法を可決し、カリフォルニア州、テキサス州、コロラド州の法律が2026年1月1日に発効しました。NISTは、2026年1月にAIエージェントセキュリティを特に対象とした最初の連邦登録要求を公表しました。
フォレスターは、エージェント型AIの展開が2026年に公開されたデータ侵害を引き起こすと予測しています。企業にとっての問題は、AIエージェントガバナンスが必要かどうかではなく、避けられないインシデントの前にそれを配置できるかどうかです。
ジョセフ・P・コンロイは、ミッションクリティカルなアプリケーション向けのAI安全およびガバナンステクノロジーを開発するデラウェア州法人であるVectorCertain LLCの創業者兼CEOです。EPA、DOE、DoD、NIHを含む連邦機関向けにAIシステムを構築した25年以上の経験を持つコンロイ氏は、EPA規制に体系化されたENVAPEMS予測排出監視システムを開拓しました。彼と彼のチームは、2001年にNYMEXで電力先物を予測するためにAIを使用した最初の人々でもありました。彼は、AIアンサンブルシステムとマルチモデルコンセンサステクノロジー全体で19以上の仮特許出願を保有しており、壊滅的なイベントが発生する統計的テールでの安全カバレッジを可能にするVectorCertainのMicro-Recursive Modelアーキテクチャを開発しました。
コンロイ氏は、AIエージェントの信頼性、AI安全、およびエンタープライズAIガバナンスに関する講演の依頼および専門家のコメントに対応可能です。
VectorCertain LLCは、メイン州に本社を置くAI安全およびガバナンステクノロジー企業です。同社の使命は、金融サービス、ヘルスケア、自動運転車、防衛、エネルギーを含む規制産業全体のミッションクリティカルなアプリケーション向けにAIシステムを数学的に証明可能にすることです。VectorCertainの特許出願中のアーキテクチャは、超コンパクトなMicro-Recursive Models(サブミリ秒のレイテンシーで動作する71〜1,500バイトのモデル)、マルチモデルコンセンサス検証、および今後のSecureAgentエンタープライズガバナンスプラットフォームを組み合わせています。
詳細については、vectorcertain.comをご覧ください。
書籍の詳細
タイトル:The AI Agent Crisis: How To Avoid The Current 70% Failure Rate & Achieve 90% Success: Based on Carnegie Mellon University's TheAgentCompany Research & Proven Implementation Strategies
著者:ジョセフ・P・コンロイ
出版社:VectorCertain LLC
入手可能:Amazon — https://www.amazon.com/dp/B0FXN4Y676
会社:https://vectorcertain.comhttps://www.amazon.com/dp/B0FXN4Y676
メディア向け
レビューコピー、エグゼクティブインタビュー、データファクトシート、高解像度の著者写真は、リクエストに応じて入手可能です。press@vectorcertain.comまでお問い合わせください。

このプレスリリースは、Newsworthy.ai
Press Release Newswire – News Marketing Platform
によって配信されています。このプレスリリースの参照URLはこちらにあります Seven Independent Studies Confirm AI Agents Fail 70–95% of the Time. A New Book by VectorCertain's CEO Shows Why—and What To Do About It..
The post Seven Independent Studies Confirm AI Agents Fail 70–95% of the Time. A New Book by VectorCertain's CEO Shows Why—and What To Do About It. appeared first on citybuzz.
