通常は目に見えないインターネットの一部が突然機能しなくなると、世界中がすぐに気づきます。これは11月18日に明らかになりました。インターネットインフラ企業であるCloudflareでの広範囲にわたる出金により、Google(およびその関連サービス)、X、ChatGPTなど、無数のウェブサイトに3時間以上にわたってエラーメッセージが表示されました。
最終的に、この事態は通常のソフトウェアバグが原因とされ、Cloudflareの広報チームは、内部設定ファイルが予想以上に大きくなり、同社のトラフィックを処理する重要なシステムがクラッシュしたと主張しました。午後半ばには修正が実施され、公式な謝罪が行われました。しかし、この事件は幅広い反省を促し、分散型コンピューティングマーケットプレイスArgentum AIのCEO、Andrew Sobkoは次のように強調しました:
Cloudflareの障害中にChatGPTユーザーが受け取ったエラーメッセージ
しかし、Cloudflareは最新の倒れたドミノに過ぎず、10月20日にはAWSが苦しみ、ルーティングとDNSの問題により数百万のユーザーが接続性の低下に直面する数時間の障害が発生しました。そしてその10日も経たないうちに、Microsoft's Azure Front Doorは経験しました共有フロントドア層全体に展開された誤設定ルールにより、ホストされている膨大な数のアプリケーションのトラフィックが約8時間にわたって誤ルーティング/ブロックされるという独自のグローバル障害を。
経済分析によると、この事件は直接的および間接的な損失として48億ドルから160億ドルの間を引き起こしたと推定されており、これには様々な銀行、物流ネットワーク、公共部門ポータル、企業SaaSツールが被った生産性の遅延や取引の失敗は含まれていません。実際、AWSとAzureの障害は一緒にCloudflareの崩壊の舞台を整えたように見え、長い間孤立した事件として片付けられていたものが、すぐにパターンのように見え始めました。
TeslaとXのオーナーであるElon Muskでさえ、公に嘲笑したAWSの障害中に、彼のソーシャルプラットフォームがAmazonのクラウドインフラなしでも問題なく機能していると自慢していましたが、今週X自体がオフラインになった時に言葉を飲み込まざるを得ませんでした。これは、一つの巨人を回避しても、他の場所での障害からプラットフォームを守ることはできないことを証明しています。
いずれにせよ、これらの連続した事件が明らかにしたことの一つは、中央集権型クラウドサービスの従来のモデルは、そのすべての利便性にもかかわらず、固有のリスクを伴うということです。なぜなら、オンライン活動の多くが少数の企業のインフラストラクチャに依存している場合、潜在的なバグや設定ミスでさえも大規模な混乱を引き起こす可能性があるからです。
これらの障害によって露呈した亀裂に直面して、技術コミュニティはますますそのような単一障害点を排除する手段を模索しています。一つの新たな答えは、クラウドコンピューティングの概念そのものを分散化することです。世界のウェブサイトやアプリケーションを少数のスーパーハブプロバイダーを通じて集中させる代わりに、負荷を多くの独立したノードに分散させるのです。
これはまさにArgentum AIがもたらしたビジョンです。コンピューティングパワーのためのオープンで人間中心のマーケットプレイスとして、コンピューティング能力をグローバルに共有されるリソースに変換し、処理能力を必要とする人々や組織と、余剰能力を提供できる人々を結びつけます(アイドル状態のGPUやサーバーのためのAirbnbのようなものです)。
詳しく説明すると、Argentumはコンピューティングタスクが公開され、複数のプロバイダーがそれらを実行するために競争する分散型のリアルタイム入札ネットワークを提供しています。このアプローチは、単一のクラウドベンダーへの依存を、多くのプロバイダーからなる透明性の高い市場に置き換え、すべてが競争力のある料金で容量を提供するために競い合っています。
また、これは一つのデータセンターやノードがオフラインになっても、ワークロードがネットワーク内の十分な容量が利用可能な場所に動的にルーティングされるため、他のノードがすぐにその役割を引き継ぐことができることを意味します。したがって、単一障害点の考え方はシステムから排除され、何らかの障害が発生した場合でも、タスクはプロバイダーの連合クラウド全体の別の場所で実行できることを意味します。
回復力を超えて、Argentum AIのマーケットプレイスは、コスト効率を主な例として、他の利点ももたらします。これは、従来のハイパースケーラーが顧客に大量のサーバーやGPU時間を予約することを要求する(多くの場合、アイドル状態の容量に対して支払う)のに対し、Argentumのネットワークは世界中に分散されたすでにアイドル状態のハードウェアを活用するためです。
この潜在的なコンピューティングパワーを解放することで、プラットフォームは従来のクラウドと比較して計算ジョブの価格を引き下げます。すべてのタスク、入札、結果はオープンなブロックチェーン台帳に記録され、価格とパフォーマンスの完全な透明性を確保します。
要するに、このモデルはコンピューティングパワーを流動的な商品として扱い、ある地域のリソースが使い果たされた場合、マーケットプレイスは他の場所でリソースを見つけます。このような柔軟性は、プロジェクト開発を加速するだけでなく、高性能処理へのアクセスを民主化し、小規模な企業や組織が主要なクラウドプロバイダーによって価格設定から排除されたり、優先順位を下げられたりすることを防ぎます。
クラウドコンピューティング時代が新たな段階に入る中、インフラの未来が少数の巨大なサイロに集中し続けるのか、それとも多くの手に分散されるのかという疑問があります。もし何かあるとすれば、2025年の障害は、最も強力な技術の巨人でさえも完璧ではないという警鐘となりました。
これに応えて、Argentum AIのようなプラットフォームは、コンピューティングパワーの割り当てとアクセス方法を再考する異なるビジョンを先駆けています。このビジョンが牽引力を得るにつれ、明日のインターネットはより回復力があり、公平になる見込みです。実際、次回CloudflareやAWSが躓いても、ユーザーはそれを感じないかもしれません。なぜなら、ワークロードはすでに他の場所に移動しているからです。


