ウッディ・ブレッドソーは、自宅のオープンガレージで車椅子に座って待っていた。数ヶ月前に彼を見ていた人――日曜日に地元のモルモン教会で彼に挨拶したり、街中でジョギングしている彼を見かけたりしていた人――にとっては、74歳の彼はほとんど見分けがつかなかっただろう。生涯を通じて維持してきた健康的な丸い頬は、今ではくぼんでいた。進行性の難病である筋萎縮性側索硬化症(ALS)によって、話すことも歩くこともできなくなり、持ち運び可能なホワイトボードに短いメッセージを消すのもやっとだった。しかし、ウッディの頭脳は依然として明晰だった。1995年初頭の朝、息子ランスがテキサス州オースティンの自宅に到着すると、ウッディはすぐにホワイトボード用インクで指示を出し始めた。
ウッディはランスに裏庭からゴミ箱を取ってくるように言った。オスカー・ザ・グラウチが使っているような、古い金属製のゴミ箱だ。ランスはそれを掴み、父親の近くに置いた。それからウッディはランスに家の中へ行き、マッチとライターオイルを取りに行かせた。ランスが戻ってくると、ウッディはガレージの中にある二つの大きなファイルキャビネットを指差した。
それらはランスが物心ついた頃からずっとそこにあった。30代後半になった今、ランスは子供の頃から開けられていなかったと確信していた。そして、それが普通のファイルキャビネットではないことも分かっていた。アメリカの原子力潜水艦のソナー装置の開発に携わっていた頃に見たのと同じ種類のものだった。耐火性があり、非常に重く、各引き出しには強力なダイヤル錠が付いていた。父親がゆっくりとホワイトボードに数字を書き始めたところ、ランスは驚いたことにその番号が通った。「最初の引き出しを開けたとき」、25年近く経った今、彼は私にそう言った。「まるでインディ・ジョーンズになったような気分でした」
中には古くて腐りかけた書類の山が積み重なっていた。ランスはそれらを取り出し、父親の手に渡した。ウッディは書類の山を5センチずつ丁寧に調べ、それから息子に、自分が焚き火台で起こした火の中に投げ込ませた。ランスは、中には「機密」や「閲覧のみ」と書かれた書類もあることに気づいた。炎はどんどん大きくなり、両方の戸棚が空になった。ウッディは、灰だけが残るまでガレージに居続けると言い張った。
ランスは、自分が一体何を破壊したのか、想像することしかできなかった。彼の父親は30年近く、テキサス大学オースティン校の教授として、自動推論と人工知能の分野の発展に尽力していた。ランスは、父親が科学に造詣が深く楽観的な人物だと常々知っていた。1950年代後半には、人間のあらゆる能力を備えたコンピューター――複雑な数学の定理を証明し、会話を交わし、卓球もそこそこできる機械――を夢見ていたような人物だった。
しかし、ウッディはキャリアの初期から、機械に人間の能力の一つ、あまり知られていないものの、危険なほど強力な能力、つまり顔認識能力を与えようという試みに没頭していた。ランスは、父親のこの分野における研究――顔認識技術に関する最初期の研究――が、米国政府の最も秘密主義的な機関の関心を集めていることを知っていた。実際、ウッディの主要な資金提供者はCIAのフロント企業だったようだ。ランスは、ワシントンが大規模かつ自動化された方法で個人を特定しようとした最初の試みの証拠を焼き尽くしてしまったのだろうか?
今日、顔認識は、携帯電話、ラップトップ、パスポート、および支払いアプリのセキュリティ機能として選ばれるようになっている。これは、ターゲット広告ビジネスに大変革をもたらし、特定の病気の診断を迅速化すると期待されている。Instagramで友達にタグ付けするのも簡単になった。しかし、それはまた、国家による抑圧と企業による監視のツールとして使われることが増えている。中国では、政府が顔認識を使用してウイグル族少数民族のメンバーを特定し、追跡しており、そのうちの数十万人が「再教育キャンプ」に収容されている。ワシントン・ポスト紙によると、米国では、移民関税執行局とFBIがデジタル捜査網としてこの技術を導入し、州の運転免許証データベースにある何百万もの顔の中から容疑者を捜索しており、場合によっては事前に裁判所命令を求めることもない。昨年、フィナンシャル・タイムズの調査で、マイクロソフトとスタンフォード大学の研究者が、対象者に知らせる、または同意を得ることなく、膨大な顔画像のデータセットを収集し、その後、公開していたことが明らかになった。 (スタンフォードのデータセットは、映像が撮影された廃業したカフェにちなんで「ブレインウォッシュ」と呼ばれていた。)両方のデータセットは削除されたが、その前にテクノロジー系新興企業や中国の軍事アカデミーの研究者らがそれらを分析する機会を得ていた。
ウッディが1960年代に手がけた顔認識研究は、こうした技術革新と、それらがもたらす倫理的な含意を予見するものだった。しかし、この分野における彼の初期の基礎研究はほとんど知られておらず、その多くは公表されることがなかった。
幸いなことに、1995年のあの日、ウッディがどんな意図を持っていたにせよ、彼の研究と書簡の大部分はガレージの火災を生き延びたようだ。数千ページに及ぶ彼の論文、39箱分が、テキサス大学ブリスコー・アメリカ史センターに保管されている。これらの箱の中には、数十枚の人々の顔写真が入っており、中には奇妙な数学記号が記されているものもあった。まるで被写体の人間が何らかの幾何学的な皮膚病に罹患しているかのようだ。これらの肖像写真から、今後数十年にわたり、より危険で、より強力で、より遍在することになる技術の起源の物語を読み取ることができる。

1965年の研究で撮影されたウッディ・ブレッドソーの画像。コンピューターは、1945年と1965年の2枚の写真が同一人物であると認識できなかった。
写真:ダン・ウィンターズウッドロウ・ウィルソン・ブレッドソー――誰からも「ウッディ」と呼ばれていた――は、働かなくて済んだ時代を思い出せなかった。1921年、オクラホマ州メイズビルに生まれ、小作農だった父の手伝いで家計を支えた幼少期のほとんどを過ごした。ブレッドソー家には全部で12人の子供がいた。10番目のウッディは、トウモロコシの草取り、薪集め、綿花摘み、鶏の餌やりに長い時間を費やした。元教師だった母は、幼い頃から彼の聡明さを見抜いていた。1976年の未発表エッセイの中で、ウッディは母を「励みになる存在」と評している――たとえ母の励ましが桃の木のスイッチを入れるという仕事から来ることがあったとしても。
ウッディが12歳の時、父親が亡くなり、大恐慌のさなか、一家はさらに貧困に陥りました。ウッディは高校を卒業するまで養鶏場で働きました。その後、ノーマン市に移り、オクラホマ大学に通い始めましたが、3ヶ月で退学し、第二次世界大戦前夜に陸軍に入隊しました。
数学の才能を発揮したウッディは、ミズーリ州フォート・レナード・ウッドの給与事務所の責任者に任命された。そこでは、次々と米兵が戦闘訓練を受けていた。(「私たちのグループは全員黒人兵士を担当していました」とオクラホマン紙は記している。「私にとっては新しい経験でした。」)そして1944年6月7日、ノルマンディー上陸作戦の翌日、ウッディはついにヨーロッパに派遣され、海岸上陸用に建造された大型海軍艦艇をライン川に進水させる方法を考案したことでブロンズスター勲章を授与された。
連合軍が勝利へと歩みを進めていたまさにその時にヨーロッパ戦線に上陸したウッディは、戦争を非常に肯定的に捉えていたようだ。「刺激的な時代だった」と彼は記している。「一日一日が普通の生活の1ヶ月分に相当する。人が戦争に魅了される理由が分かる。勝ち続け、多くの犠牲者を出さない限り、万事順調だ」。翌年の夏は解放されたパリで過ごし、時折高揚した愛国心に包まれる雰囲気の中で、彼の知性と世界に対する経験は大きく広がった。「私が聞いた中で最もセンセーショナルなニュースは、我々が原子爆弾を爆発させたということだった」とウッディは記している。「そのような兵器が敵ではなくアメリカ人の手に渡ったことを嬉しく思った」
ウッディは戦争が終結したらすぐにでも大学に戻りたいと思っていました。ユタ大学で数学を専攻し、2年半で卒業した後、バークレー大学で博士号を取得しました。大学院卒業後はニューメキシコ州のサンディア研究所に就職し、水素爆弾の発明者の一人であるスタニスワフ・ウラムをはじめとする著名な人々と共に、政府資金による核兵器研究に携わりました。1956年、ウッディはエニウェトク環礁上空の核兵器実験を視察するためマーシャル諸島へ飛びました。エニウェトク環礁の一部は、今日に至るまでチェルノブイリや福島よりも深刻な放射能汚染に苦しんでいます。「愛する祖国が世界で最も強力な国であり続けることに貢献できたことは、私にとって大きな満足感でした」と彼は記しています。
サンディア研究所は、ウッディにコンピューティングの世界への第一歩を踏み出させ、それが彼のその後のキャリアを左右することになる。当初、彼のコード作成への取り組みは、核兵器研究における陰鬱な計算に直接結びついていた。初期の取り組みの一つである「大規模熱核攻撃による放射性降下物の確率を計算するプログラム」は、爆発の威力、爆発点、爆発時間、平均風速などを考慮し、攻撃を受けた際に放射性降下物がどこに落下するかを予測するプログラムだった。
しかし、コンピューターへの情熱が深まるにつれ、ウッディは自動パターン認識、特に機械読み取り、つまりコンピューターにラベルのない文字の画像を認識させるプロセスに興味を持つようになった。彼は、発明家で航空技術者で生物物理学者でもあった友人であり同僚のアイベン・ブラウニングとチームを組み、のちのちnタプル法として知られるようになる方法を開発した。彼らはまず、印刷された文字 (たとえばQ )を方眼紙のような長方形のセルのグリッドに投影した。次に、文字の一部が含まれているかどうかに応じて各セルに 2 進数を割り当てた。つまり、空白セルには 0、文字が含まれているセルには 1 を割り当てた。次に、セルをランダムにグループ化して、座標セットのように順序付きのペアにした (理論的には任意の数のセルをグループ化できるため、nタプルという名前が付けられている)。さらに数学的な操作をいくつか加えることで、コンピューターは文字のグリッドに一意のスコアを割り当てることができるようになった。コンピュータが新しい文字に遭遇すると、最も近い一致が見つかるまで、その文字のグリッドをデータベース内の他の文字と比較するだけです。
n組法の優れた点は、同じ文字の様々なバリエーションを認識できることでした。ほとんどのQは、他のQとかなり近いスコアを示す傾向がありました。さらに素晴らしいことに、このプロセスはテキストだけでなく、あらゆるパターンで機能しました。数学者であり、ウッディの長年の友人でもあるロバート・S・ボイヤーとの共著論文によると、n組法はパターン認識の分野を定義するのに役立ち、「どうすれば人間と同じようなことを機械にさせることができるか?」という問いに対する初期の取り組みの一つでした。
n組法を考案していた頃、ウッディは初めて「コンピューター人間」と名付けた機械を組み立てるという夢を思い描きました。数年後、彼は人工意識に必要なスキルのリストを思いついた時の「狂おしいほどの興奮」を回想しています。
「紙に印刷された文字だけでなく、手書きの文字も読めるようにしたかったんです。眼鏡に装着できる小さなカメラで、あるいはその一部でも見ることができて、耳栓も付いていて、街で出会った友人や知人の名前を耳元でささやいてくれるんです。…というのも、私のコンピューターの友人は顔認識能力を持っていたんです。」
1960年、ウッディはブラウニングとサンディア研究所の3人目の同僚と共に独立し、独自の会社を設立しました。パノラミック・リサーチ・インコーポレーテッドは当初、カリフォルニア州パロアルトの小さなオフィスを拠点としていました。当時、シリコンバレーと呼ばれていなかった地域です。当時、世界のコンピュータのほとんどは、パンチカードや磁気テープにデータを保存する巨大なマシンで、大企業のオフィスや政府の研究所に設置されていました。パノラミックは自社でコンピュータを導入する余裕がなかったため、近隣の企業からコンピューティング時間を借りていました。多くの場合、料金は割安になる深夜に利用していました。
ウッディが後に同僚に語ったところによると、パノラミックの事業は「『世界を動かす』と期待されるアイデアを試すこと」だった。パノラミックの複数のプロジェクトに協力し、後にパーソナルコンピューティング誌の創刊編集者となった作家兼コンサルタントのネルス・ウィンクレスによると、「彼らの役割は文字通り、他の人が馬鹿げていると思うようなことをすることだった」という。
同社は、多種多様な研究者を引きつけました。その多くは、ウッディのように大恐慌時代に何も持たずに育ち、今ではあらゆることを探求したいという人たちでした。彼らの性向は、聡明なものから野性的なものまで様々でした。貧しい農家の出身で、幼少期の2年間をほぼキャベツばかり食べて過ごしたブラウニングは、常に何かをいじくり回す人でした。かつて彼は、パノラミック社の別の研究者であるラリー・ベリンジャーと共同で、犬が動力で動かすトラック「ドッグ・モービル」のコンセプトを練り上げました。また、彼らは「ヒア・ア・ライト」と呼ばれる、光のレベルを音に変換する視覚障害者用のペン型デバイスも開発しました。
ベリンジャーは10代の頃、ウィングウォーカーとして働いていた(パラシュート着陸の失敗でできた痣を自転車の怪我だと偽り、母親には趣味を秘密にしていた)。また、トム・ウルフ監督の映画『ライトスタッフ』で有名になった、音速を突破するロケット飛行機「ベルX-1」の設計にも携わった。後に彼は、「完全にランダムかつ無人的に芝を刈る」ための自走式芝刈り機「モウボット」を開発した(ジョニー・カーソンが『ザ・トゥナイト・ショー』でこの装置を紹介した)。
そして、ロボットプログラミングのパイオニア、ヘレン・チャン・ウルフがいました。彼女は大学卒業後数年でパノラミック社に入社しました。彼女は後に、電気電子工学研究所が「人工知能を体現した世界初のロボット」と評したロボット「シェーキー」のプログラミングに携わりました。かつての同僚の一人からは「ロボット界のエイダ・ラブレス夫人」と呼ばれています。1960年代初頭、ウルフのプログラミング作業には高さ30センチほどのパンチカードの山が必要だった頃、パノラミック社の同僚たちが次々と投げかけるアイデアの多彩さに、彼女は畏敬の念を抱きました。ある時、ウッディは「DNAを解読したいと思い、当時のコンピューターでは30年か37年かかるだろうと計算しました。私は『まあ、それはやらないわね』と言いました」と彼女は言います。
おそらく当然のことながら、パノラミック社は十分な商業資金調達に苦労しました。ウッディは、エクイタブル生命保険協会やマッコールズ誌といった企業顧客に文字認識技術を売り込もうと懸命に努力しましたが、結局契約には至りませんでした。1963年までに、ウッディは会社が倒産するだろうとほぼ確信していました。
しかし、パノラミック社は創業以来、少なくとも一つ、会社を支えてきた信頼できるパトロン、つまり中央情報局(CIA)を抱えていた。ウッディの文書にCIAへの直接的な言及があったとしても、おそらくは彼の私道で灰燼に帰したのだろう。しかし、ウッディのアーカイブに残された証拠の断片は、パノラミック社が長年にわたりCIAのフロント企業と取引していたことを強く示唆している。パノラミック社の全社員と親しく、ブラウニングの生涯の友人でもあったウィンクレスは、同社は少なくとも部分的にはCIAからの資金提供を念頭に置いて設立された可能性が高いと述べている。「誰もはっきりとは教えてくれなかったが、事実はそうだった」と彼は回想する。
難解な情報公開法に基づく請求を専門とするウェブサイト、ブラック・ボールトが入手した記録によると、パノラミックは、CIAの悪名高い「マインドコントロール」プログラムであるプロジェクトMKウルトラに参加した80の組織のうちの1つだった。このプログラムは、しばしば嫌がる被験者に精神的拷問を加えることでよく知られている。医療科学研究財団というフロント組織を通して、パノラミックは、細菌および真菌の毒素の研究と「特定の動物種の活動の遠隔方向制御」に関するサブプロジェクト93と94に割り当てられていたようだ。セント・マーチンズ大学の人類学者デビッド・H・プライスの研究によると、ウッディらはCIAのフロント組織である人間生態学研究協会からも資金提供を受けていた。同協会は、CIAの尋問技術の向上やその研究のカモフラージュに役立つ可能性のある研究を行う科学者に助成金を提供していた。 (CIAはウッディやパノラミックに関する知識や関係について肯定も否定もしていない。)
しかし、ウッディのパノラミックでの最も注目すべき研究に資金を提供していたのは、キング=ハーレー研究グループという別のフロント企業だった。1970年代に起こされた一連の訴訟によると、キング=ハーレーはCIAがエア・アメリカとして知られるCIAの秘密空軍のために飛行機やヘリコプターを購入するために使っていたダミー会社だった。キング=ハーレーは一時期、スタンフォードでの精神薬理学の研究にも資金を提供していた。しかし、1963年初頭、キング=ハーレーはウッディ・ブレッドソーという人物から別の種類の売り込みを受けた。彼は「簡易顔認識マシンの実現可能性を判断するための研究」を行うことを提案した。n組法に関する彼とブラウニングの研究を基にして、彼はコンピュータに10人の顔を認識させるつもりだった。つまり、コンピュータに10人の異なる人々の写真のデータベースを与え、各人の新しい写真を認識させることができるかどうかを確認したかったのだ。 「すぐに参加者を数千人にまで増やせると期待している」とウッディは記した。1ヶ月も経たないうちに、キング=ハーレーは彼にゴーサインを出した。

あるアプローチでは、ウッディ・ブレッドソーはコンピューターに顔を特徴ごとに分割し、それらの間の距離を比較するように教えました。
写真:ダン・ウィンターズ10人の顔認識は、今では取るに足らない目標に思えるかもしれませんが、1963年当時は息を呑むほど野心的な目標でした。文字認識から顔認識への飛躍は、まさに途方もないものでした。そもそも、写真をデジタル化する標準的な方法も、利用できるデジタル画像のデータベースも存在していませんでした。今日の研究者は、無料で入手できる何百万枚もの自撮り写真を使ってアルゴリズムを訓練できますが、Panoramic社は写真を一枚ずつ、ゼロからデータベースを構築する必要がありました。
さらに大きな問題がありました。生きた人間の 3 次元の顔は、ページ上の 2 次元の文字とは異なり、静的ではありません。同じ人物の画像でも、頭の回転、照明の強さ、角度が異なる場合があります。人は年齢や髪型が変わります。ある写真では無邪気に見える人が、次の写真では不安そうに見えるかもしれません。途方もなく複雑な分数の共通分母を見つけるかのように、チームはこのすべての変動を何らかの方法で補正し、比較する画像を正規化する必要がありました。また、彼らが使用できるコンピューターがタスクに適しているかどうかは、ほとんど確実ではありませんでした。彼らのメインマシンの 1 つは、192 KB の RAM を搭載した CDC 1604 でした。これは、基本的な最新のスマートフォンの約 21,000 分の 1 のワーキング メモリです。
ウッディは当初からこれらの課題を十分に認識していたため、分割統治法を採用し、研究をいくつかの部分に分割して、それぞれを異なる Panoramic 研究者に割り当てました。一人の若い研究者がデジタル化の問題に取り組みました。彼はプロジェクトの被験者の白黒写真を 16 mm フィルムに撮りました。次に、ブラウニング社が開発したスキャン デバイスを使用して、各写真を数万のデータ ポイントに変換しました。各データ ポイントは、画像内の特定の場所における光の強度値 (0 (完全に暗い) から 3 (完全に明るい) まで) を表します。しかし、これはコンピューターが一度に処理するにはデータ ポイントが多すぎたため、若い研究者は NUBLOB と呼ばれるプログラムを作成しました。これは、画像をランダムなサイズのスウォッチに切り分け、それぞれに対してn組のようなスコアを計算するプログラムです。
一方、ウッディ、ヘレン・チャン・ウルフ、そしてある学生は、頭の傾きをどう捉えるかを研究し始めた。まず、被写体の顔の左側、額の頂点から顎にかけて、皮膚に番号付きの小さな十字を描いた。次に、被写体が正面を向いている写真と、45度回転した写真の2枚を撮影した。この2枚の画像で小さな十字の位置を分析することで、同じ顔を15度または30度回転させた場合の見え方を推測することができた。最終的に、マークアップされた顔の白黒画像をコンピューターに取り込むと、不気味で点描画のような、そして驚くほど正確な、自動的に回転した肖像画が浮かび上がった。
これらの解決策は独創的ではあったものの、不十分だった。作業開始から13ヶ月が経過した時点で、パノラミックチームはコンピュータに人間の顔を1つも認識させられておらず、ましてや10人の顔を認識させるとは到底考えられなかった。毛の成長、表情、そして老化という三重の要因が「計り知れない変動の要因」となっていると、ウッディは1964年3月にキング=ハーレーに提出した進捗報告書に記している。この課題は「当時のパターン認識技術とコンピュータ技術の最先端の技術をはるかに超えている」と彼は述べた。しかし、彼は顔認識に取り組むための「全く新しいアプローチ」を試すための研究に資金提供を行うことを推奨した。
その後の1年間で、ウッディは、顔認識の自動化への最も有望な道は、顔を目、耳、鼻、眉、唇といった主要な特徴間の関係の集合へと還元することだと信じるようになった。彼が思い描いたシステムは、現代のマグショットを発明したフランスの犯罪学者アルフォンス・ベルティヨンが1879年に開発したシステムに似ていた。ベルティヨンは、左足の長さや肘から中指の先までの長さなど、11の身体的測定値に基づいて人物を描写した。十分な測定値を取れば、すべての人がユニークになるという考えだった。このシステムは手間がかかったが、うまく機能した。1897年、指紋採取が普及する何年も前に、フランスの憲兵はこのシステムを使って連続殺人犯ジョゼフ・ヴァシェの身元を確認した。
1965年を通して、パノラミック社は顔認識のための完全自動化ベルティヨンシステムの開発に取り組みました。チームは写真の明暗パターンを解析することで鼻や唇などを特定できるプログラムを考案しようとしましたが、その試みはほぼ失敗に終わりました。
そこでウッディとウルフは、顔認識に対するいわゆる「マンマシン」アプローチ、つまり人間の支援を少し取り入れる手法を模索し始めた(最近機密解除されたCIA研究開発局の歴史には、1965年にまさにそのようなプロジェクトがあったことが記されている。同年、ウッディは同局の分析主任、ジョン・W・カイパーズに顔認識に関する手紙を送っている)。パノラミック社は、ウッディの10代の息子グレゴリーとその友人の1人に、約50人の人物を映した122枚の写真の山を調べさせ、それぞれの顔について耳の上から下までの長さや口の端から端までの幅など、22カ所の寸法を計測させた。次にウルフは、その数値を処理するプログラムを書いた。
実験の最後に、コンピューターはすべての測定値を正しい写真と照合することができました。結果は控えめでしたが、否定できないものでした。ウルフとウッディは、ベルティヨン方式が理論的に機能することを証明したのです。
1965年末、彼らは次に、ほぼ同じ実験の大規模版を行うことにした。今回は、当時発明されたばかりの技術を用いて、マンマシンシステムにおける「人間」の効率をはるかに向上させた。キング=ハーレーの資金で、彼らはRANDタブレットと呼ばれる1万8000ドルの装置を使用した。これはフラットベッド型画像スキャナーに似た外観だが、iPadのような動作をする。研究者はスタイラスペンを使ってタブレットに描画し、比較的高解像度のコンピュータで読み取り可能な画像を作成することができた。
ウッディ氏と同僚たちは、学部生たちに次々と新しい写真群を順に見てもらい、RANDタブレットに一枚一枚置き、スタイラスで重要な特徴をピンポイントで書き込むように指示した。この作業は依然として骨の折れるものだったが、以前よりはるかに速く進んだ。学生たちは合計で約2,000枚の画像(各顔が少なくとも2枚ずつ)のデータを、1時間あたり約40枚のペースで入力することができた。
しかし、これほど大きなサンプル数であっても、ウッディのチームはいつもの障害を克服するのに苦労した。例えば、笑顔は「顔を歪ませ、顔の輪郭線を劇的に変化させる」ため、コンピューターは依然として苦労していた。加齢も依然として問題であり、ウッディ自身の顔がそれを証明した。1945年のウッディの写真と1965年のウッディの写真を照合するように指示されたとき、コンピューターは困惑した。歯を見せて笑い、黒ずんだ眉毛を持つ若い男性と、険しい表情で薄毛の老いた男性の間にほとんど類似点を見いだせなかったのだ。まるで数十年もの歳月が経った別人のようだった。
そしてある意味で、彼らはそれを実現した。この時点で、ウッディはパノラミックの新たな契約獲得に奔走し、「仕事が多すぎるか足りないかという馬鹿げた状況」に陥ることにうんざりしていた。彼は資金提供者に絶えず新しいアイデアを売り込んでいたが、その中には今となっては倫理的に疑わしい領域に踏み込んだものもあった。1965年3月――中国が新疆ウイグル自治区のウイグル族を特定するために顔パターン照合を使い始める約50年前――ウッディは国防総省高等研究計画局(当時はアルパと呼ばれていた)に対し、顔の特徴を用いて人の人種的背景を判定する実現可能性を研究するため、パノラミックを支援するよう提案した。「世界中の様々な人種的・環境的背景を持つ人々に対して、非常に多くの人類学的測定が行われてきました」と彼は記している。「長年にわたり多大な費用と労力をかけて収集された、この膨大で貴重なデータは、適切に活用されていませんでした」。アルパがこのプロジェクトへの資金提供に同意したかどうかは不明だ。
明らかなのは、ウッディが回収の保証もないまま、パノラミックに数千ドルもの私財を投じていたことだ。一方、テキサス大学オースティン校の友人たちは、安定した給与をちらつかせながら、ウッディにパノラミックで働くよう勧めていた。ウッディは1966年1月にパノラミックを去った。同社はその後まもなく倒産したようだ。
コンピューター人間を作るという夢を頭の中でまだ描いていたウッディは、自動推論の研究と教育に専念するために、家族を連れてオースティンへ移住した。しかし、顔認識に関する研究はこれで終わりではなかった。その集大成はすぐそこにあったのだ。
1967年、オースティンへの移住から1年以上経った後、ウッディは最後の任務を引き受けました。それは、人間の顔のパターンを認識するというものでした。この実験の目的は、法執行機関が顔写真や肖像画のデータベースを迅速に精査し、一致するものを探すのを支援することでした。
これまでと同様に、このプロジェクトの資金は米国政府から提供されたようだ。2005年にCIAによって機密解除された1967年の文書には、捜索時間を100分の1に短縮する顔認識システムに関する「外部契約」について言及されている。記録によると、今回は資金は仲介役を務める個人を通じて提供されたようだ。この仲介役と思われる人物はメールでコメントを控えた。
このプロジェクトにおけるウッディの主要な協力者は、スタンフォード研究所(現在はSRIインターナショナルとして知られているが、この研究所は軍事資金への過度の依存が学内で物議を醸していたため、1970年にスタンフォード大学から分離した)の応用物理学研究所の研究エンジニア、ピーター・ハートだった。ウッディとハートは約800枚の画像のデータベースから始めた。新聞用紙品質の写真が2枚ずつあり、それぞれ約「白人成人男性400人」が写っており、年齢や頭の回転がさまざまだった(ウッディの顔認識研究のいずれにも、女性や有色人種の画像やそれらへの言及は見当たらなかった)。彼らはRANDタブレットを使用して、写真1枚あたり46の座標を記録した。これは、両耳に5つずつ、鼻に7つ、両眉に4つずつだった。ウッディが以前に画像の変動を正規化していた経験を基に、彼らは数式を使用して各頭を前向きの位置まで回転させた。次に、スケールの違いを考慮するために、瞳孔間の距離を基準として、各画像を標準サイズに拡大または縮小しました。
コンピュータの課題は、それぞれの顔の片方のバージョンを記憶し、それを用いてもう片方の顔を識別することでした。ウッディとハートは、このマシンに2つの近道を提案しました。1つ目はグループマッチングと呼ばれるもので、コンピュータは顔を特徴点(左眉、右耳など)に分割し、それらの相対的な距離を比較します。2つ目のアプローチはベイズ決定理論に基づき、22個の測定値を用いて顔全体について推測を行います。
最終的に、2つのプログラムはほぼ同等の精度でタスクを処理しました。さらに重要なのは、人間の競合相手を圧倒したことです。ウッディ氏とハート氏が3人の人間に100人の顔のサブセットをクロスマッチングさせたところ、最も速い人でも6時間を要しました。CDC 3800コンピューターは同様のタスクを約3分で完了し、時間を100分の1に短縮しました。人間は頭の回転や写真の画質の悪さへの対応が得意だったとウッディ氏とハート氏は認めましたが、コンピューターは加齢による差異への対応において「はるかに優れていた」とのことです。総合的に見て、彼らは機械が人間を「圧倒」、あるいは「ほぼ圧倒」していると結論付けました。
これはウッディが顔認識研究で達成した最大の成功だった。しかし、この研究は彼がこのテーマで執筆した最後の論文でもあった。この論文は公表されることはなかった。ハートによれば「政府の都合」のためであり、二人ともそれを嘆いた。ハートとの共同研究が終了してから2年後の1970年、ロボット工学者のマイケル・カスラーが、ベル研究所のレオン・ハーモンが計画していた顔認識研究についてウッディに知らせた。「この二流の研究が今になって発表され、現在利用できる最高のマンマシンシステムであるかのように思われるのは腹立たしい」とウッディは答えた。「レオンが一生懸命頑張れば、1975年までに私たちより10年近く遅れをとることになるのではないかと思う」。数年後、ハーモンの研究がサイエンティフィック・アメリカン誌の表紙を飾った一方で、彼自身のより進んだ研究が実質的に保管庫にしまわれたとき、彼はきっと苛立ったに違いない。
その後数十年にわたり、ウッディは自動推論への貢献で数々の賞を受賞し、人工知能振興協会(AAI)の会長を1年間務めた。しかし、顔認識における彼の研究はほとんど評価されず、忘れ去られ、他の人々がその役割を引き継いだ。
1973年、日本のコンピュータ科学者、金出武雄が顔認識技術に大きな飛躍をもたらしました。当時非常に希少だった、主に1970年の吹田万博で撮影された850枚のデジタル写真データベースを用いて、金出は人間の入力なしに鼻、口、目といった顔の特徴を抽出できるプログラムを開発しました。金出はついに、人間と機械のシステムから人間を排除するというウッディの夢を実現したのです。
ウッディは長年にわたり、一度か二度、顔認識の専門知識を掘り起こした。1982年、彼はカリフォルニア州の刑事事件の専門家証人として雇われた。メキシコマフィアの一員とされる男が、コントラコスタ郡で連続強盗を犯したとして告発された。検察側は、防犯カメラの映像など、複数の証拠を持っていた。その中には、ひげを生やし、サングラスをかけ、冬用の帽子をかぶり、長い巻き毛の男が映っていた。しかし、被告の顔写真は、ひげをきれいに剃り、短髪の男だった。ウッディはパノラマ画像解析ソフトを使って銀行強盗の顔を計測し、被告の写真と比較した。弁護側は大いに喜んだが、ウッディは鼻の幅が異なるため、顔が2人の別人である可能性が高いことを突き止めた。「どうしても合わなかったんです」と彼は語った。男は結局刑務所に入ったが、ウッディの証言に関連する4つの罪状については無罪となった。
ミシガン州立大学のコンピューター科学者で『Handbook of Face Recognition』の共同編集者であるアニル・K・ジェイン氏は、顔認識が現実世界の不完全さに対処できるようになったのはここ10年ほどのことであると言う。実際、ウッディが遭遇した障害のほとんどはなくなった。第一に、デジタル化された画像は今では無尽蔵に存在する。「ソーシャルメディアをクロールすれば、好きなだけ顔を取得できる」とジェイン氏は言う。さらに、機械学習、記憶容量、処理能力の進歩により、コンピューターは事実上自己学習する。いくつかの基本ルールを与えると、コンピューターは膨大な量のデータを解析し、人間の顔からポテトチップスの袋まで、事実上あらゆるもののパターンをマッチングする方法を見つけ出すことができる。RAND錠やベルティヨン測定は必要ないのだ。
1960年代半ば以降、顔認識は大きく進歩しましたが、ウッディは、この分野が今もなお解決を目指している多くの問題を定義しました。例えば、顔の位置の変動性を正規化するという彼のプロセスは、今もなお重要な課題の一部です。ジェイン氏によると、顔認識の精度を高めるために、今日のディープラーニングネットワークは、顔のランドマークを用いて新しい位置を推定し、顔を正面向きに再調整することがよくあります。今日のディープラーニングベースのシステムは、人間のプログラマーから鼻や眉毛を明示的に識別するように指示されることはありません。しかし、1965年にウッディがその方向に転向したことは、その後数十年にわたるこの分野の方向性を決定づけました。「最初の40年間は、この特徴に基づく手法が主流でした」と、現在カーネギーメロン大学ロボティクス研究所の教授であるカナデ氏は言います。今、ある意味で、この分野は、ウッディが人間の顔の謎を解こうとした初期の試み、つまりn組法のバリエーションを用いて巨大なデータポイントのフィールドから類似パターンを見つけようとした頃のような状況に戻っています。顔認識システムは複雑になってきているが、実際には一対の画像の類似度スコアを作成し、それらを比較しているだけだとジェイン氏は言う。
しかし、おそらく最も重要なのは、ウッディの研究が、長きにわたり問題を抱えてきた顔認識研究の倫理的な方向性を定めたことです。ソーシャルメディア、YouTube、クアッドコプタードローンなど、世界を変えるほどの技術が、長年の実用化を経て初めてその破滅的な可能性を露呈したのとは異なり、顔認識技術の潜在的な悪用可能性は、パノラミックにおける誕生当初からほぼ明らかでした。ウッディの時代の遺物として片付けられるような偏見の多く、例えばサンプルセットがほぼ白人男性に偏っていたこと、政府権威への一見無頓着な信頼、顔認識を人種差別に利用しようとする誘惑などは、今日でもこの技術を悩ませ続けています。
昨年、Amazonの顔認識ソフトウェア「Rekognition」のテストで、NFL選手28人が犯罪者と誤認された。数日後、ACLU(アメリカ自由人権協会)は、Amazon、Microsoft、その他の企業が開発した顔認識技術の使用状況に関する情報を求めて、米国司法省、FBI、DEAを提訴した。米国国立標準技術研究所(NIS)が2019年に発表した報告書では、顔認識ソフトウェアを開発する50社以上のコードをテストした結果、白人男性は他のグループよりも顔写真との誤認が少ないことが判明した。2018年には、2人の学者がこの分野を強く批判する論文を発表し、「顔認識技術は、これまでに発明された監視メカニズムの中で最も独特で危険なものだと我々は考えている」と述べている。
1993年の春、筋萎縮性側索硬化症(ALS)による神経変性により、ウッディの言語は不明瞭になり始めました。彼の死後に書かれた長文の追悼文によると、彼は言語が不明瞭になるまでテキサス大学で教鞭をとり、ペンを握れなくなるまで自動推論の研究を続けました。「常に科学者であったウッディは、病気の進行を記録するために自分の音声を録音していました」と著者らは記しています。彼は1995年10月4日に亡くなりました。オースティン・アメリカン・ステイツマン紙に掲載された彼の死亡記事には、顔認識に関する研究については一切触れられていませんでした。記事に併載された写真では、白髪のウッディがカメラをまっすぐ見つめ、満面の笑みを浮かべています。
ショーン・ラヴィヴ (@ShaunRaviv) はアトランタ在住のライターです。彼は 第26.12号で神経科学者カール・フリストンについて執筆しました。
この記事は2月号に掲載されています。 今すぐ購読をお願いします。
この記事についてのご意見をお聞かせください。 [email protected]までお手紙をお送りください。
WIREDのその他の素晴らしい記事
- 香港の抗議行動はいかにしてマッドマックスの舞台と化したのか
- チャットルーレットはオンラインの混沌を象徴する言葉だった。そして2010年代が到来した。
- 『スター・ウォーズ/スカイウォーカーの夜明け』は軍事における対立の教訓である
- 「クソロボットの女王」が王座を放棄した理由
- アルプスの氷河の見事なデザイン
- 👁 AIという分野は近いうちに「行き詰まり」を迎えるのか?さらに、人工知能に関する最新ニュースも
- 🎧 音に違和感を感じたら、ワイヤレスヘッドホン、サウンドバー、Bluetoothスピーカーのおすすめをチェック!