みなさん、こんにちは。マレナです。私はThe Markupの調査記者ですが、いつもの深掘り調査から少し離れて、もっと軽やかな話題について話したいと思います:鳥です!
\ より具体的には、人工知能(AI)が鳥類学の世界をどのように再形成しているかに興味を持つようになりました。その最も重要な方法の一つが、BirdCastというプロジェクトを通じたものです。これは機械学習を使用して、気象データに基づいて鳥の移動を予測する科学者を支援するプロジェクトです。
\ BirdCastは、コーネル大学鳥類学研究所、コロラド州立大学、マサチューセッツ大学アマーストの共同プロジェクトです。2018年に開始され、アメリカ本土48州にある143のレーダーサイトから収集されたデータを使用して、鳥の動きを特定し、それらの鳥がどのように移動するかを予測しています。
アンドリュー・ファーンズワースはコーネル大学鳥類学研究所の客員科学者で、1990年代のプロジェクト開始時から携わり、現在のBirdCastの反復に繋がる助成金を執筆しました。以下のインタビューは明確さと長さのために編集されています。
\ マレナ: バードウォッチングをどのように始めたのですか?
アンドリュー:科学者である祖父がいました。彼は生化学者でしたが、家に双眼鏡を持っていて、当時フィールドガイドの最先端と考えられていた資料も持っていました。ニューヨーク市の郊外であるウェストチェスター郡の比較的緑豊かな場所にいたことと相まって、それがきっかけとなりました。アメリカホシハジロとコゲラが入り口のような存在でした。
\ マレナ:鳥の移動を理解することがなぜ重要なのですか?
アンドリュー:これには3つの良い、合理的に単純な答えがあります。基本的なレベルでは、鳥は環境とその環境の健全性の非常に良い指標です。そのため、特に渡り鳥を研究することは、地球の多くの部分を繋げるため、私たちの生態系はどうなっているのか、どのように評価するのか、どれほど健全なのかを定量化し評価する非常に良い方法です。
\ また、人々を巻き込む非常に良い方法でもあります。
\ そして3つ目は基礎科学に関するものです。双眼鏡や空に耳を傾ける観察者として私たちが行うパターンと観察を理解することは、私たちが持つ技術から学べるすべてのことと同様に重要であり、ますます繋がっています。米国上空を夜間に移動する鳥の数について数字を得たのは2018年になってからでした。それは知りたい基本的な量です。
\ マレナ:BirdCastでは人工知能と機械学習がどのように使用されていますか?
アンドリュー:レーダーデータから、何が気象で何が生物学的または鳥なのかを抽出する必要があります。それにラベルを付け、「ああ、このデータでは鳥についてのみ話している」と非常に迅速に割り当てることができるモデルに変換するために、機械学習が不可欠です。そして多くのデータがあり、それらのデータにラベルを付けることができるため、機械学習を行う絶好の機会です。プロジェクトにおける機械学習の最も重い作業は、降水量やその他の大気現象とは対照的に、鳥の移動について話すデータセットの作成に関連しています。
\ 機械学習が関与し始めている他の興味深い周辺領域があり、おそらく今後ますます増えていくでしょう。例えば、追加データの統合などです。レーダーは鳥の数や大規模なパターンを伝えるのに優れていますが、種を識別することはできません。市民科学やコミュニティ科学と呼ばれるもの、基本的には鳥の観察...または夜間に移動する鳥の飛行コールや発声...の統合は、ますます機械学習駆動の取り組みになるでしょう。そしてそれは多くの計算を必要としますが、今後数年以内に十分達成可能なものだと思います。
\ マレナ:どれくらい正確ですか?
アンドリュー:何が鳥で何がそうでないかの一般的なパターンについて、モデルは...本当によく機能しています。パーセンテージ、ある種の正確さを割り当てようとすると、90%台後半のようなものです。そして私たちはまだそれをさらに訓練する必要があります。常に興味深い新しいケースがありますが、それらはますます稀になっています。
\ 予測モデルは異なります。なぜなら予測モデルはそのデータセット(レーダー上の鳥の移動)を他のもの(気象変数)に関連付けているからです。そのモデルも[約80パーセントの精度で]非常によく機能します。80パーセントは100パーセントではないので完璧ではありません。しかし、米国全体で鳥の移動強度を予測するのに十分すぎるほど良く、何年にもわたって一貫してそれを行うことができます。
\ マレナ:これらのアルゴリズムを訓練して鳥を他のすべてから選び出す方法について、どのようなことを探すように指示していますか?
アンドリュー:最初に「これは気象学的なもので、これはそうではない」と強調するいくつかの本当に単純なパターンがあります。レーダーでよく見られる気象学は、雨の非常に不規則なパターンです—レーダー画像に現れる形状が均一でないという点で不規則です。また、反射率、つまりレーダーに散乱して戻るエネルギーの量を記述するピクセル値も持つ傾向があり、それらは非常に変動します。例えば雷雨のように—非常に高い強度で、非常に局所的です。
\ そしてそれはレーダー上の鳥の移動信号とは非常に異なるパターンであり、率直に言って昆虫も同様です。生物学的パターンは[傾向として]非常に均一であり、激しく変動したり不規則な形状を持ったりしません。専門家としてこれらのデータにラベルを付けるとき...[あなたは言うことができます]「鳥の移動について知っていることと、鳥が昆虫よりもはるかに検出される可能性が高いレーダーの波長を考えると、これを鳥の移動としてラベル付けします。そして、ああ、そうそう、風がどうなっているかも知っています。そしてレーダーに対する大気中のものの速度についてレーダーから来る別のデータ製品があります。ああ、そしてこれらのものはそれに対して動いています—これらは間違いなく鳥です。」
\ 繰り返しますが、それは完璧ではありません。波長の問題にもかかわらず、鳥ははるかに検出される可能性が高いですが、非常に大きくて速く飛ぶ昆虫が非常に多数存在するケースがあります。だから私たちが「それは鳥なのか昆虫なのか?わからない。それが生物学的なものであることは知っている。気象学的なものではない」とわからない場所があります。だからそのようにラベル付けします。モデルではそれらのデータをあまり使用していません。しかし将来的には使用するでしょう。そのデータセットが成長すれば、価値あるものに成長するでしょう。それは別の将来のことです。
\ マレナ:すでにいくつかのことを言及しましたが、BirdCastをより良くするためにAIがまだできないことは何ですか?そしてそれを達成するにはどれくらい近づいていますか?
アンドリュー:最も生のレーダーデータには、レーダー局から直接出てくるような、生物学者として通常見ることができない多くの情報があります。それは気象学的な観点からすぐにフィルタリングされ、調整されます。[AIは潜在的に]追加のパターンを解決し、レーダーが生成する異なる瞬間を活用するモデルを持つことができるでしょう。
\ より単純なレベルでは、特に...「これが生物学的なものであることはわかっているが、何かはわからない」という鳥、昆虫、コウモリのインターフェースに関して、現在の機械学習モデルをさらに改善する本当の機会があります。
\ マレナ:より一般的に、AIは鳥類学の分野をどのように変えていますか?
アンドリュー:かなり大きな方法で変化させています。一般的な観点から見ると、これらの種類のモデルとこの種の計算能力を使用して画像や音を認識し...非常に高い信頼性でそれを行うことができるという考えは、非常に大きなことです。人々はそれに気づいていないかもしれません—彼らは「バードウォッチングに出かけているとき、あまり技術と関わっていない。はい、私は電話をIDガイドとして使用し、答えがわからない場合はいくつかの質問に答えてもらいます」と考えるかもしれません。しかしそれは、あなたがそれを行うたびに機械学習と直接関わっていることを意味します。だから私は、私たちが観察を行う方法に非常に広く大きな繋がりがあると思います。
\ マレナ:鳥類学は一般の人々が意味のある貢献をすることができる数少ない科学分野の一つです。AIに関して一般市民は鳥類学でどのような役割を果たしていますか?
アンドリュー:実際に本当に重要な役割があると思います。人間はAIモデリングとすべての機械学習において、彼らが専門家であるという点で重要です。「ああ、私はロビンを見た、そして10羽見た、そして彼らはこの特定の場所にいた」というところから得られるあなたの脳内で行うすべてのことは、これらのモデルが前進するための不可欠な情報です。そして貢献は生データとなり...機械学習はそれに基づいて操作します。そして外に出て、レーダーデータが大気中の何かをサンプリングしている地上の観察者になり、その接続を行うことができる他の場所があり、これらはその種の地上検証に重要です。人間が生成する情報は、それが何であれ、あなたが専門家であるか初心者であるかにかかわらず、これらの機械学習モデルが操作するカーネルのように本当に不可欠になる可能性があります。
お読みいただきありがとうございます。
\ 敬具、
\ マレナ・カロロ
\ 調査記者
\ The Markup
\ こちらでも公開
