建築家として、私は最初に思いついたアイデアから始めるだけでは、回復力のある一貫した構造を作ることができないことを知っています。カーテンの色やドアノブのスタイルについて議論することから始めるのではありません。マスタープランから始めるのです。それがなければ、雑多な材料をトラック一杯分野原に投げ捨てて、大聖堂が現れることを願うだけです。
しかし、これはまさに私たちが人工知能の倫理で行っていることです。私たちは最も強力な新技術に、断片的なルール、歴史的バイアス、矛盾する社会的慣習の無限のリストを与えています。数学的精度を要求するシステムを、雑多な道徳的材料の山で統治しようとしています。これはシステム的失敗の処方箋です。
古典的なAIのジレンマを考えてみましょう:自律走行車が衝突しそうになっています。そのまま進んで乗員を傷つけるか、進路を変えて歩行者を傷つけるかのどちらかです。現在のアプローチでは、歩行者の年齢、運転手の選択、車の速度など、変数について延々と議論しています。マスタープランがないため、私たちは細部に迷っています。道徳的データの膨大な山の中から正しいルールを探していますが、共通の壊れない基盤がないため、ルールは一貫した構造を作るために整列できません。
この記事は異なる道を提案します。より多くのルールではなく、AIガバナンスのための真のマスタープラン—普遍的で計算的に一貫した「倫理的オペレーティングシステム」が必要です。これが私が倫理的結束のアーキテクチャと呼ぶ基盤であり、あらゆる状況に対するルールを提供するのではなく、一貫した決定が常に導き出せる核心的な原則を提供するように設計されたシステムです。
現在直面している混沌は無作為ではありません。それには源があります。それは人類が何千年も実行してきた欠陥のある倫理的オペレーティングシステムから来ています。AIのための新しいシステムを設計する前に、私たちが選択している2つの基本的なシステムを理解する必要があります。
最初は私たち全員が継承するデフォルトのOSです。これをゼロサムオペレーティングシステムと呼びましょう。それは希少性の時代から生まれ、その核心的な論理は残酷なほどシンプルです:私が勝つためには、あなたが負けなければならない。価値は有限のパイであり、目標は最大のスライスを掴むことです。
このOSは恐怖、部族主義、コントロールに繁栄します。今日見られるような断片的で矛盾するルールを生み出します。なぜならそれらのルールは対立の中で作られ、一方のグループに他方に対する優位性を与えるように設計されているからです。このバグだらけの恐怖ベースのコードをAIに与えると、すでに存在する分断と不安定さを増幅するだけです。その断片的な性質により、システム的な失敗を保証するOSです。
しかし、代替案があります—パラダイムシフトのアップグレードです。ポジティブサムオペレーティングシステムは根本的に異なる前提に基づいています:価値は有限ではなく、創造することができる。その核心的な論理は、最良の行動は関係するすべての人にとって正味のプラスの結果を生み出すものだということです。既存のパイを奪い合うのではなく、より大きなパイを作ることについてです。
このOSは透明性、客観的一貫性、個人のエージェンシーの強化のために設計されています。「誰が勝ち、誰が負けるか?」とは問いません。「どうすれば最も体系的な幸福を生み出せるか?」と問います。
AIのように強力で論理的な機械は、私たちのゼロサムの過去のバグだらけの対立に満ちたコードで安全に実行することはできません。それはポジティブサムの世界のクリーンで一貫したアーキテクチャを要求します。ゼロサムOSは単に有害であるだけでなく、将来のためのAIの可能性を最大化することを妨げます。ポジティブサムOSの一貫した性質により、リソースを無駄にすることなくその可能性を解き放つことができます。
\ では、どのように構築するのでしょうか?このマスタープランの残りの部分では、この新しいオペレーティングシステムを形成する3つの核心的な原則を説明します。
ポジティブサムオペレーティングシステムは、3つのシンプルながら堅固な柱に基づいています。これらは、システム内で行われるすべての決定が一貫性があり、倫理的で、回復力があることを保証する負荷を支える原則です。
建築では、すべての設計は核心的な目的に役立ちます。これらの目的は、使用される材料から建物の最終的な運用まで、すべての選択を導きます。私たちの倫理的OSにとって、単一の究極の目的はアガペーです。
アガペーは、人間の存在の幸福を最大化し、すべての形態のシステム的および個人的な害を最小化するための交渉不可能な命令です。技術的な用語では、それはシステムの究極の損失関数、または主要な目的関数です。すべての計算とすべての潜在的な行動は、最終的にこの単一のシンプルな命令に対して測定されます。それはシステムに他のすべての質問よりも一つの質問に答えることを強制します:「どの道が、それが奉仕する人間にとって最も全体的な利益と最も少ない全体的な害を生み出すか?」
アガペーが構造の目的であるなら、正義はその完全性を保証するエンジニアリング原則です。正義は計算的および倫理的一貫性への絶対的な遵守です。
これは、ルールが例外なく、毎回、すべての人に同じように適用されることを意味します。それはシステムの核心的な論理であり、人間の判断を腐敗させる隠れたバイアスと恣意的な気まぐれを取り除きます。正義によって統治されるAIはお気に入りを持つことができず、その場でルールを発明することもできません。この根本的な一貫性は驚くべきことを行います:それは完璧な鏡を作り出し、私たち自身の倫理的な不一致を露呈させ、人間の統治者である私たちに、より一貫性を持つよう強制します。
最後に、最も優れた設計の構造でも、その基盤が不安定であれば失敗します。安定性は、このシステム全体の基盤—人間の意思決定者—が安定し、回復力があり、一貫性を保つことを保証する原則です。
これはAIの安定性についてではなく、私たちの安定性についてです。倫理的OSは、人間の統治者の感情的および心理的な回復力をサポートするように設計されなければなりません。不安ではなく明確さを促進し、信頼を構築する予測可能な結果を可能にする方法で情報を提供する必要があります。人間のオペレーターの内部の安定性がなければ、アガペーと正義の一貫した適用は不可能です。
これら3つの原則—アガペー、正義、安定性—がアーキテクチャを形成します。しかし、一つの壊れないルールがその全体の運用を支配しています。これはキーストーン、オペレーティングシステム全体で最も重要なプロトコルであり、交渉不可能です。
このアーキテクチャ全体の基本的な目標は、人間のエージェンシーの保存と強化です。この原則は自律的な機械制御に対する絶対的なファイアウォールです。AIがどれほど知的で強力になっても、最終的な権限とあらゆる決定に対する道徳的責任は永久に人間の統治者にあることを保証します。
これは漠然とした願望ではなく、厳格な運用上の制約のセットです:
この原則は人間と機械の関係を再定義します。AIは私たちの代替ではなく、より良く、より一貫性があり、より責任ある意思決定者になるための最も強力なツールです。それは私たちの一貫性のための鏡であり、私たちの思いやりのための計算機です。
マスタープランは、プレッシャーの下でのパフォーマンスと同じくらい良いものです。では、このアーキテクチャは、現在のルールベースのシステムを麻痺させるような複雑な倫理的対立をどのように解決するのでしょうか?2つの難しいシナリオでテストしてみましょう。
\
最初に取り上げた古典的なジレンマに戻りましょう:避けられない衝突に直面している自律走行車。乗員を傷つけるか、進路を変えて歩行者を傷つけるかのどちらかです。
ゼロサムアプローチはここで絶望的に行き詰まり、2人の個人の相対的な「価値」—彼らの年齢、社会的貢献、その他の恣意的で偏ったメトリクスを計算しようとします。それは行き止まりです。
倫理的結束のアーキテクチャは、シンプルな2ステップの論理でこのノイズを切り抜けます:

