積み木やオレオの積み重ねを見ると、私たちは直感的に、それがどれほど安定しているか、倒れそうかどうか、そしてどの方向に倒れるかを察知します。これは、積み重ねられた物体の質量、質感、大きさ、形状、そして向きを考慮した、かなり高度な計算です。
ジョシュ・テネンバウム率いるMITの研究者たちは、私たちの脳には直感的な物理エンジンとでも呼べるものが備わっているという仮説を立てています。感覚を通して得られる情報は不正確でノイズが多いものですが、それでも私たちはおそらく何が起こるかを推測し、その推測に基づいて行動します。そのため、私たちは道を避けたり、米俵が倒れないように急いで走ったり、耳を塞いだりすることができます。このような「ノイズの多いニュートン力学」システムは確率的な理解を伴うため、失敗する可能性があります。不安定な形状に積み重なった岩の画像を想像してみてください。

スチュアート・ディー/ゲッティイメージズ
これまでの経験から、脳は敵が立ったままでいるのは不可能だと認識しているはずです。しかし、敵はそこにいるのです。(これは、グランド・セフト・オートのようなビデオゲームの物理エンジンと非常によく似ています。このエンジンは、プレイヤーと3D世界におけるオブジェクトとのインタラクションをシミュレートします。)
数十年にわたり、常識を備えた人工知能は、この分野における最も困難な研究課題の一つでした。現実世界における物事の機能とそれらの関係性を「理解」し、意図、因果関係、そして意味を推論できる人工知能です。AIは長年にわたり驚異的な進歩を遂げてきましたが、現在導入されているAIの大部分は、Google画像などの膨大な学習データを用いて統計モデルを構築する統計機械学習に基づいています。データは人間によって「猫」や「犬」などのラベルでタグ付けされ、機械のニューラルネットワークは、人間と同じくらい正確に画像が何であるかを推測できるようになるまで、あらゆる画像にさらされます。
このような統計モデルが欠如している点の一つは、対象が何であるかを理解することです。例えば、犬は動物であるとか、犬が時々車を追いかけるといったことです。そのため、これらのシステムは正確なモデルを構築するには膨大な量のデータを必要とします。なぜなら、画像内で何が起こっているかを理解するよりも、パターン認識に近い処理を行っているからです。これは、より高速なコンピュータと膨大なデータセットによって可能になった、力ずくの「学習」アプローチです。
これは、子どもの学習方法とも大きく異なります。テネンバウム氏は、ドイツ・ライプツィヒにあるマックス・プランク進化人類学研究所のフェリックス・ワーネケン氏、フランシス・チェン氏、マイケル・トマセロ氏によるビデオをよく紹介します。このビデオでは、小さな子どもが、大人がクローゼットのドアに何度もぶつかる様子を見つめています。大人は明らかに中に入ろうとしているものの、うまく開けることができません。数回試みた後、子どもはドアを引いて開け、大人が通れるようにします。人間にとっては可愛らしくも当然のことのように思えること、つまり、いくつかの例を見て解決策を導き出すことは、実際にはコンピュータにとって非常に困難です。大人のためにドアを開ける子どもは、その状況の物理的性質を本能的に理解しています。ドアがあり、蝶番があり、引いて開けることができますが、クローゼットに入ろうとする大人は、ドアをそのまま通り抜けることはできません。子どもは、自分が理解している物理的性質に加えて、数回の試行の後、大人はドアを通ろうとしているものの、うまくいかないことを推測することができます。
これには、人間には計画や意図があり、それを達成するために助けが必要になったり、助けが必要になったりする可能性があることを理解する必要があります。複雑な概念を習得し、その概念が実現される具体的な条件を学ぶ能力は、子どもたちが自然に、監督なしに習得できる領域です。
うちの9ヶ月の娘のような乳児は、現実世界との交流を通して学びます。その交流は、彼女の脳内の様々な直感的なエンジンやシミュレーターを訓練しているようです。その一つは、テネンバウムの言葉を借りれば「物理エンジン」で、積み木を積み上げたり、コップを倒したり、椅子から落ちたりすることで、重力や摩擦、その他のニュートンの法則が私たちの生活の中でどのように現れ、私たちができることの限界を設定するのかを理解するようになります。
さらに、乳児は生まれた瞬間から、顔を認識し、視線を追跡し、世の中の他の社会的対象がどのように考え、行動し、自分や他の人とどのように交流するかを理解しようとする社会的なエンジンを発揮します。ワシントン大学の言語聴覚科学教授であるパトリシア・クールが提唱するこの「社会ゲーティング仮説」は、私たちの発話能力は、乳児期の社会的交流を通じた社会的理解の発達と根本的に結びついていると主張しています。ハーバード大学の認知心理学者エリザベス・スペルケとその共同研究者たちは、乳児が生後10ヶ月という早い時期から、人々の目的を推測する「直感心理学」をどのように発達させるかを明らかにしようと研究を進めています。
ダニエル・カーネマンは著書『ファスト&スロー』の中で、私たちの脳の直感的な部分は統計や数学があまり得意ではないと説明しています。彼は次のような問題を提示します。野球のバットとボールを合わせて 1 ドル 10 セントです。バットはボールより 1 ドル高いです。ボールの値段はいくらでしょうか? 私たちの直感は 10 セントと答えたくなりますが、それは間違いです。ボールが 10 セントで、バットが 1 ドル高いとすると、バットは 1 ドル 10 セントになり、合計は 1 ドル 20 セントになります。正しくは、ボールが 5 セントでバットが 1 ドル 05 セントなので、合計は 1 ドル 10 セントです。明らかに、自然界に存在する積み重なった岩が私たちの内なる物理エンジンを混乱させるのと同じように、統計に関する私たちの直感を欺くことは可能です。
しかし、学者や経済学者はしばしばこうした例を挙げて、科学や学術研究における直感の役割を過小評価しようとしますが、これは大きな間違いです。物理的または社会的状況を素早く判断するのに役立つ直感的なエンジンは、説明不可能なほど複雑な計算を行っています。線形的に計算することは不可能かもしれません。例えば、熟練したスキーヤーでさえ自分の行動を説明できませんし、説明書を読むだけでスキーのやり方を習得することもできません。脳と体全体は、線形思考なしにすべてが機能するフロー状態に入るために、非常に複雑な方法で動き、同期し、動作することを学びます。
乳児期には、脳は劇的な変化を遂げます。乳児の脳は、成人の2倍のニューロン間の接続を発達させ、脳が成熟するにつれて、これらの接続は刈り込まれていきます。彼らの脳は、階段、お母さん、お父さん、友達、車、雪山など、自分たちが関わる複雑なシステムに対する直感的な理解を発達させます。中には、海を航行するために数十種類の波の違いを学んだり、雪の種類の違いを学んだりする子もいます。脳が発達するにつれて、成熟するにつれて重要ではないと思われる接続は刈り込まれていきます。
言葉を使って説明し、議論し、互いに理解し合う能力は非常に重要ですが、言葉は簡略化された表現であり、人によって異なる意味を持つ可能性があることを理解することも重要です。私たちが知っている多くの考えや物事は、言葉で表現することはできません。たとえ言葉で表現できたとしても、言葉は実際の考えや理解の要約以上のものを伝えることはできません。
スキーの滑り方を説明できない熟練スキーヤーを軽視すべきではないのと同様に、物事のバランスが崩れていると自然が告げるのを聞くシャーマンの直感も軽視すべきではありません。先住民の感性や自然との関係性について、彼らには説明できず私たちにも理解できないという理由で「原始的」と私たちが考えるのは、実は環境に対する直感エンジンが欠如していることに起因しているのかもしれません。私たちの感覚は、都会の世界で必要なくなったため、そうしたニューロンを刈り込んでしまったのかもしれません。私たちは人生の大半を、本やスクリーンに鼻を突っ込み、個室に座って世界を理解するための教育を受けながら過ごします。数学的または経済的に物事を説明できるということは、幼少期から自然環境に浸かり、直感的に理解する人々の脳よりも、生態系などのことをより深く理解しているということなのでしょうか。
おそらく、謙虚さをたっぷりと持ち、私たちが教育水準が低いと見なす人々、つまり教科書ではなく実践と観察を通して学んだ人々の非線形で直感的な思考を統合する努力をすれば、物事の仕組みや、現代のツールでは解決できない問題に対して何ができるのかを理解する上で、大きな助けとなるだろう。これはまた、多様性の重要性を改めて示すものでもある。還元主義的な数学モデルや経済モデルは工学的な観点からは有用だが、そのようなモデルを用いて複雑適応システムを記述する能力には限界があることを自覚すべきだ。そのようなモデルは直感を真に考慮に入れておらず、人間の経験における直感の役割を軽視するリスクをはらんでいる。
テネンバウム氏とその同僚たちが、世界の直感的なモデルを学習できる機械の開発に成功すれば、当初は説明できない、あるいは現在の理論やツールでは理解できないほど複雑な事柄を提示する可能性がある。機械学習やAIモデルにおける説明可能性の向上を目指す場合でも、先住民族が自然とどのように関わっているかを探る場合でも、説明可能性の限界に到達するだろう。説明可能な範囲を超えたこの領域こそが、科学の刺激的な最先端であり、私たちが現在の世界理解の先にある発見と探求を進める場なのだ。
新しい知性
- ディープラーニングには限界があり、欠点もあります。
- Google の AI はこれまで人間の耳には聞こえなかった音を発明しました。
- AI は、おそらく核兵器よりもさらに、戦争を劇的に変える可能性を秘めている。
写真:WIRED/ゲッティイメージズ