データガバナンスに関する現代の議論は、データを主に社会的・技術法的な人工物として捉えるデータ理想主義によって損なわれています。データ倫理、「信頼に基づく自由な流れ」、データ脱植民地化、データフェミニズム、倫理的AIの開発など、データ理想主義にはさまざまなバリエーションがあり、これらは基本的に、デジタル時代の社会的、政治的、経済的な結果の多くが透明性、公平性、倫理的な整合性のメカニズムを通じて管理できることを示唆しています。これは構造的な盲目性の一例です。ここで私は、計算の公平性という考えから、インフラの所有権、標準化のレバレッジ、そしてこの非代替性資産を管理するための戦略的能力というより具体的な現実へと焦点をシフトする必要がある修正として、データリアリズムを提案します。
これには、データリアリズムの以下の5つの重要な原則を認識する必要があります:
これを否定することは認識論的プロジェクトを放棄することになります - データは不完全で、形作られ、媒介されているかもしれませんが、それでも世界との接触です。データが現実へのインターフェースとしての基本的な役割を受け入れると、データリアリズムは、データへの広範かつコスト効率の良いアクセスを可能にすることを要求します。目標は、データコモンズの有用性を創造し最大化しながら、システミックリスクを最小化することです。今日、AI企業や開発者は、どのデータをどのように使用できるかについての明確さを必要としています。促進的な調達フレームワークは、訴訟の絶え間ない脅威を取り除き、開発チームが法的リスク管理を心配するのではなく、モデルの品質とパフォーマンスに集中できるようにします。現在の公共データのボトルネックはAIにおける競争を抑制しています。
「物事を機能させる」ことに焦点を当てることは、データリアリズムが公開されているデータの収集を合法化する政策を提唱することを意味します。現在の法的曖昧さと倫理学者による非難はスタートアップを麻痺させています。確かに、スクレイピングには明確な技術標準(レート制限、robots.txtの遵守、匿名化の義務付け、機密データや非必須データの除外など)が必要ですが、基本的なデータアクセスのコストを下げ、データコモンズを作成することで、国家はAI企業に対して、最大かつ最悪の独自データ収集者であるかどうかではなく、優れたモデリング、文脈的応用、アルゴリズムの革新で競争するよう強制することができます。
これに代わるものとして、キュレートされた文脈的な公共データセットへのより多くの公的および民間投資が必要です。これらの精査されたデータセットは、スタートアップの初期データ調達コストを下げ、モデル開発のための標準化されたベンチマークを作成し、高価で、アドホックで、法的にリスクのあるスクレイピングの努力に取って代わることができます。ここでの規制政策は、自然独占が保有する必須の公益データに対するデータ共有や標準化されたAPIを義務付け、匿名化された高品質のデータセットをオープンソースコモンズに自発的に提供するよう奨励する必要があります。さらに、データが世界との接触であるならば、特定のメトリクスへの過度の依存は信号を歪める可能性があるため、データリアリズムは質的な洞察と指標の多様性を取り入れた全体的な現実の捕捉も要求します。
これは、データ生産が環境を通じて位置づけられ、フィルタリングされることを意味します - データは抽象的なものではなく、どこかから来て、誰かによって作られ、道具、プロトコル、そして権力によって形作られる重要なリソースです。データは現実を表現するだけでなく、実行もします - 特に情報システムがますます自動化されるにつれて - データは公共の言説を形作り、政策に情報を提供し、実際の人間と機械の行動を調整します。データインフラの物質性は一時的なものとは程遠く、データは物理的なシステムによって保存、循環、維持され、それらは重要な生態学的および地政学的な足跡を残します。すべての相互作用が痕跡を残すため、データリアリズムは、データが単に「収集される」のではなく、その起源と生産がインフラ化されていることを認識することを要求します。データ理想主義の学派がデータに関する道徳的議論に焦点を当てるとき、彼らはまた、現職の覇権者(および彼らの倫理的優先事項)のインフラ的支配を変更不可能な前提として受け入れ、その基盤に挑戦するのではなく、支配的な権力システムを改善しようとします。
したがって、成功したデータリアリスト国家は、グローバルな技術開発の軌跡を自国の戦略的計算に統合するために必要な「政治の永続的な見方」を育成し、データを取り巻く主権的な技術および管理標準の開発を優先し、デジタル産業の地理を国家安全保障目標に明示的にリンクさせなければなりません。世界に勝者と敗者がいるように、デジタル社会にはデータ権力とデータ州があります。
データリアリズムは監視、ダッシュボード、スプレッドシート、または技術官僚的なガバナンスの擁護ではありません。それは、人間の言説や設計の外部にある何か - 抵抗し、驚かせ、私たちのモデルを偽造することができる何か - としての現実の擁護です。そのために、データリアリズムは2つの支配的な傾向を拒否します:
素朴な経験主義 — データが「自分自身で語る」という考え、数字は中立で、測定は無実だという考え。この見方は文脈、バイアス、または解釈を考慮に入れることができません。
急進的構成主義 — データは権力に満ちた構成物に過ぎず、完全にイデオロギー、ナラティブ、位置性によって形作られるという見方。この見方は世界を消去し、認識論を政治に崩壊させ、しばしばそのためだけに行われます。
リアリストの立場は、データ化への盲目的な信仰と純粋な相対主義のニヒリズムの両方を拒否します。データリアリズムは文脈、イデオロギー、または構造を否定しません。それは、それらを通してでも、世界が漏れ出ることを主張します。温度の読み取り。死亡率。投票数。これらは単なるナラティブではありません。それらは私たちを制約します。データを実際のものとして扱うことは、それらを真剣に受け止めることです - 最終的な真実としてではなく、世界との暫定的な接触としてです。それは、これらすべてが何を示し、何を意味するのかを問うことであり、誰がそれを作り、なぜ作ったのかだけを問うことではありません。したがって、データは理想化なしに分析されなければなりません。不便または醜い(例えば、不平等、腐敗を示す)場合でも、データの厳しい事実へのコミットメントは必要であり、統計的なガスライティングは文明的に有毒です。データは操作される可能性があります。しかし、操作は歪められる可能性のあるベースラインを前提としています。投票数の偽造は、実際の投票数という考えにまだ依存しています。死亡率の検閲は、死亡があったことをまだ暗示しています。データで嘘をつくことは、真実が重要であることを認めることです。なぜなら、あるレベルでは、データは私たちの政治的信念や道徳的願望とは無関係に存在し、機能する非交渉的な現実だからです。これは、私たちのシステム、人間または人工的なものを訓練およびテストするために使用されるデータに最高の精査を適用する必要があることを意味します。
データは目的ではなく、産業、軍事、学術能力の指標です。国家の真のデータ能力は、その人口のデータフットプリントのサイズではなく、外部のサプライチェーンやガバナンスフレームワークに依存せずに、そのデータを標準化、保存、計算する独立した能力によって測定されます。これには、軍事、学術、産業目標の体系的な統合が必要です - デジタル技術標準をグローバルな公共財として扱い、戦略的に行使され、単に受動的に消費されるだけではない科学と産業の結合です。理想主義的な主張とは対照的に、国家安全保障は国家レベルでのデータガバナンス決定を駆動する最終的な政策エンジンであり、プライバシーと倫理は二次的でしばしば交渉可能な制約として機能します。覇権的および新興の権力のデータ政策は、技術的優位性を確保することに根本的に根ざしています。したがって、任務は孤立を通じて依存性を排除することではなく、そのゲームのルールを形作るためにデータシステムで必要なレバレッジを獲得することです。
理想主義的なデータ政策は、無政府的なシステムでの同意と協力を前提としているため、政治的に素朴です。例えば、G7のDFFTナラティブは、普遍的な善としてしばしば投影されますが、それはほとんど「信頼に基づく自由な流れ」の優雅なレトリックであり、抽象的な法的約束を使用して、認められていないグローバルな政治的コントロールの具体的な現実を隠すマスクとして機能します。したがって、データリアリスト国家は、すべての政策を単純だが厳格なテストにかける必要があります:この政策は主権能力を測定可能に増加させ、構造的依存性を減少させるのか、それとも単に権力者との道徳的遵守を達成するだけなのか?したがって、データリアリズムは、司法-警察国家(法律の制定と執行に焦点を当てた)から構造的国家(デジタル能力とメタポリシー空間の構築と所有に焦点を当てた)への意味のあるシフトを要求します。
データリアリズムは実践的な倫理へのコミットメントであり、理想主義ではありません。それは対角線上に対立する左/右システムの概念を避けます。それは効果的な技術加速の哲学であり、技術的悲観主義の哲学ではありません。実践的な倫理は、データフローの倫理的必要性との直接的かつ即時の対決を要求します - 収集、クリーニング、モデリング、解釈の方法を、結果として生じる決定の影響を受ける人々にできるだけ透明にすることです - しかし、監査と是正の権利を超えて、データ管理者は、世界がどうあるべきかという願望をデータパイプラインに投影することに悩む必要はありません。データの所有権は真実の所有権であり、したがって、彼らの管理下にあるデータを保護し、リスクを軽減し、必要に応じて、システムの継続性のためにその所有権を移転する責任を負います。ここでのガバナンスの主要な任務は、データとシステムを倫理的にすることではなく、計算、所有権、能力の測定可能な構造的事実に直面し、それを習
