ウェブ検索は疑問を解決すると約束した。しかし、実際には真実の穏やかな終末をもたらした。

写真イラスト:WIREDスタッフ、ゲッティイメージズ
WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。
廊下はLEDの幻影のような、強烈な白に染まっている。壁沿いには、果てしなく遠くへと続く扉がいくつも並んでいる。それぞれの扉の基部には青い光の冠が飾られているが、あなたが以前通った扉は深い紫色に輝いている。しかし、それらは門の砂漠に散らばる砂粒に過ぎない。
あなたは何かを探しています。
困難な旅路に備えよ。最初の扉の前に、台座が現れる。台座の上に置かれた箱は、周囲の壁と同じくらい質素でありながら、金箔を貼られたような雰囲気を漂わせている。箱には題名こそ記されていないが、その名は直感的に心に響く。「アンサーボックス」。銘板にはこう記されている。
私はあらゆる扉をくぐり抜けてきました。この廊下の扉だけでなく、存在するあらゆる廊下の扉、扉の中にある扉、そして、あえて見せられない扉、恐怖で逃げ出してしまうような扉も。私は全てを見てきました。私は公平です。あなたのことを心から思っています。あなたが知りたいことを理解していますし、それは知ることができます。あなたが求める答えは、私にはあります。
指でラッチを撫でます。
ウェブのカタログ化は、最初から失敗する運命にあった。1993年の夏、マシュー・グレイはWorld Wide Web Wanderer(WWWW)を作成した。これは、おそらく最初のインターネットボットであり、ウェブクローラーでもある。ウェブをインデックス化する最初の公式な試みにおいて、Wandererは130個のURLを携えて遠征から帰還した。しかし、インターネット黎明期においてさえ、このリストは不完全だった。
シンプルなウェブクローラーの仕組みを理解するために、ニューヨーク、東京、パリの3都市を含む旅行プランを立てることを想像してみてください。それぞれの目的地を訪れながら、他の都市への言及があれば、それを旅程に追加します。増え続けるリストにあるすべての都市を訪れれば、世界クロールは完了です。旅の終わりまでに多くの場所を訪れることができるでしょうか?間違いなくそうでしょう。しかし、世界全体を見ることができるでしょうか?ほぼ間違いなくそうではありません。このプロセスでは実質的に見えない都市、あるいは都市のネットワーク全体が必ず存在するのです。
ウェブクローラーも同様にURLリストを参照し、見つかったリンクを再帰的に訪問します。しかし、結果として得られるインデックスは、インターネットの包括的なディレクトリと混同すべきではありません。そのようなものは存在しません。
私は、あらゆる情報製品を医師から図書館員までの範囲に位置付けるテクノロジー理論を持っています。
医師の第一の目的は、あなたを文脈から守ることです。診断や治療において、医師は長年の訓練、研究、そして個人的な経験に基づきますが、その情報をありのままに提示するのではなく、凝縮し、統合します。これには十分な理由があります。医師の診察を受ける際、あなたの第一の目的は好奇心を刺激されたり、一次情報源を調べたりすることではなく、診断や治療という形で答えを得ることです。医師はあなたの時間を節約し、誤解を招く可能性のある情報や不必要な不安を抱かせる可能性のある情報からあなたを守ってくれます。
対照的に、司書の主な目的は、あなたを文脈へと導くことです。あなたの質問に答える際、司書は長年の訓練、研究、そして個人的な経験を活用し、それを使ってあなたを知識システム、そしてその知識システムの背後にいる人間との対話に引き込みます。司書は短期的にはあなたを目的地に早く連れて行ってくれるので時間の節約になるかもしれません。しかし長期的には、その目的地がポータルであることが明らかになることを望んでいます。彼らは考えることが骨の折れる作業ではなく、豊かになることだと考えており、自分たちの専門知識は解決策ではなく道案内にあると理解しています。あなたが司書に質問すると、司書はあなたが尋ねることさえ考えなかった質問への答えとなる本を指し示してくれることがあります。あなたが本を取りに書庫まで歩いていくと、代わりに別の本が目に留まることもあります。これも司書にとっては成功です。
「私が読んだから、あなたは読まなくていい」(医師)という書評もあれば、「私が読んだから、あなたも読むべき」(図書館員)という書評もあります。ソファでくつろぎながら、いつまでもくすぶる、実現されていない旅への憧れを掻き立ててくれるアプリ(医師)もあれば、立ち上がって出かけたいと思わせるアプリ(図書館員)もあります。
検索エンジンの本質は、人間が作ったページ、つまり図書館員が作ったページへの訪問を支援する製品です。2004年のプレイボーイ誌のインタビューで、Googleの共同創業者であるラリー・ペイジは、「ユーザーをGoogleからできるだけ早く引き出し、適切な場所に誘導したい」と明言しました。しかし、ここ10年間でGoogleは医学部を卒業したと言ってもいいでしょう。答えは王様です。単なるリンクは、テクノロジーの失敗に他なりません。
Google 検索は、World Wide Web Wanderer の 5 年後に開始されました。その主なイノベーションは、他の「信頼できる」サイトがリンクしている頻度に基づいて各 Web サイトの信頼性スコアを作成する PageRank アルゴリズムでした。このスコアは、どのサイトをどのくらいの頻度でインデックスするかを決定するだけでなく、検索結果でそれらのサイトをどの程度上位にランク付けするかを決定するためにも使用されました。
ここで、この取り組みの大胆さを強調しておきたい。2007年、Googleが初めてGoogleストリートビューの実現にあたり、世界中の3Dスキャンデータを取得すると発表した時のことを覚えている。途方もなく途方もない、途方もない規模の作業に思えた。しかし、10年かけて、圧倒的な経済力か、それとも労働力の創造的な活用(あるいは搾取)かはわからないが、Googleはまさにそれを成し遂げた。少なくとも、私たちはそう確信している。
大規模なアーカイブプロジェクトはどれも、シェイクスピアの悲劇のように、常に同じ結末を迎える。つまり、未完のまま終わるのだ。毎晩公演を続ける傲慢な役者と、企業の支配者の全知全能性、遍在性を信じ、疑念を抱かずにいられる観客が必要となる。なぜなら、通りの数は現実的にスキャンできる数よりも多く、一度スキャンしたとしても、通りは進化し続けるからだ。建物は取り壊され、木々は高くなり、帝国は滅亡する。記号化されたものは記号化されたものから遠ざかる。だからこそ、難しい決断を下さなければならない。そして、それらの決断の中には、どの場所を保存する価値があるかというイデオロギーが潜んでいる。
ウェブサイトの数は、道路の総距離を何桁も上回っています。
インデックスの構築は確かに面倒ですが、それは課題の一部に過ぎません。検索クエリを結果リストに処理するという課題もあります。通常、これには自然言語処理(NLP)が関係します。これは、コンピューターが人間のコミュニケーションを解釈するのを支援する一連の技術です。基本的なNLPアルゴリズムでは、「パンを焼く」というクエリを個々のトークン(baking、a、loaf、of、bread)に分割し、クエリにそれほど意味を追加しない一般的な単語(baking、loaf、bread)を削除し、単語のバリエーションに一致するように単語を基本形(bake、loaf、bread)に縮小し、一般的な同義語(bake、cook、prepare、make、craft、loaf、bread)を含めるようにクエリを拡張します。
しかし、Googleが現在使用しているより高度なNLP技術は、相互接続された機械学習アルゴリズムを巧みに組み合わせ、検索者にとって最も有用な結果を予測するものです。その根底にある目標は、利用可能なあらゆる文脈的手がかり(現在の出来事、ユーザーの位置情報、検索履歴、言語、デバイスなど)を用いて、ユーザーの「意図」を理解することです。ユーザーが「火星」という単語を検索するとき、彼らは惑星、神、遺伝子、チョコレートバー、現在形の動詞、それともネブラスカ州の都市に関する情報を探しているのでしょうか?
もちろん、「自然言語」というのは少々誤解を招く表現です。私たちがGoogleに話しかける方法には、(口語的な意味での)「自然」なところなどありません。友人のところへ歩いて行って、「近くのイタリアンレストラン」とか「Netflixで観られるロマンティックコメディは?」とわめき散らすようなことはしません。メディア学者のジョン・カルキン神父の言葉を借りれば、「私たちは道具を形作り、そして道具が私たちを形作る」のです。言い換えれば、私たちは機械が答えられると考える方法で質問をするように進化し、時とともに技術的に解決可能な質問を優先するようになります。Googleは私たちの意図を本当に理解できるのでしょうか?本当に理解できるのでしょうか?
ユーザーの意図を解釈し、大規模なインデックスからリンクのリストを返すソフトウェアは、十分に使える検索エンジンです。しかし、2010年代初頭から、Googleは検索エンジンのあり方について根本的に異なるビジョンを採用してきました。それは、検索結果ページで質問に直接回答できる検索エンジンです。この機能は、リッチアンサー、ダイレクトアンサー、インスタントアンサー、クイックアンサー、注目スニペット、ナレッジパネルなど、紛らわしく変化し続ける様々な名称で呼ばれてきましたが、ここでは口語的な包括的なカテゴリである「アンサーボックス」を使用します。
ナレッジグラフは、構造化データを含む個別のエンティティの観点から世界を捉えるセマンティックネットワークであり、Googleがこのビジョンを追求する上で重要な役割を果たしています。例えば、ナレッジグラフでは、Boygeniusというバンドはジャンル、レコードレーベル、ディスコグラフィー、画像、リンクや動画のリストと関連付けられており、メンバーのJulien Baker、Phoebe Bridgers、Lucy Dacusも含まれています。彼らはそれぞれ、グラフ内でエンティティとみなされ、独自の関連データを持っています。
回答可能な質問の範囲をもう少し広げるために、Googleは「パッセージランキング」と呼ばれる手法も使っている。これは、ユーザーの質問がページの焦点であるかどうかに関わらず、その質問に答えそうなページから特定の抜粋を選び出すものだ。パッセージランキングは、Boygeniusがどのように出会ったのか(「ジュリアンとルーシーはワシントンD.C.で同じ公演を行い、その1ヶ月後にジュリアンはフィービーと出会った」)、バンド名の由来(「男性は自由な空間を持つ権利があると教えられている…『ボーイジーニアス』とは、人生を通して自分のアイデアが天才的だと教えられてきた人のこと」)、そして1400語に及ぶニューヨーカー誌のプロフィールから、ジュリアン・ベイカーの「身長5フィート(約1.5メートル)、体重105ポンド(約47キロ)」といった情報も教えてくれる。
これらのリッチリザルトが示す世界観は、知る価値のあるあらゆる情報が明確かつ完璧に細分化できるというものです。いわば、知識の野球カード化と言えるでしょう。それ以外の情報については、まあ、少しスクロールする必要があります。The Markupによる2020年の調査によると、最も人気のある検索クエリに対するGoogleのモバイル検索結果ページのほぼ半分が、「ナレッジパネル」「他のユーザーはこちらも質問しています」「強調スニペット」などのセクションを介したGoogle独自のプロパティへのリンクで占められていました。
ウェブクローリング、ページランク、自然言語処理、ナレッジグラフ、パッセージランキングといったこれらの技術はすべて、私たちに一連の嘘を信じ込ませるために収束します。「私は全てを見てきた。私は公平だ。私はあなたの利益を心から願っている。あなたが知りたいことを理解しているし、それは知ることができる。あなたが求める答えは私にはある。」
アンサーボックスの10年間の栄光は、少なくとも現在の形では、終わりを迎えようとしているのかもしれない。Googleは、検索結果ページに生成AIを組み込む実験を行っていることを、盛大に発表した。これにより、Googleは「ボーイジーニアスの音楽のユニークさや特別な点を教えてください」や「ボーイジーニアスの未発表曲のタイトルを使って詩を書いてください」といった、より間接的なクエリへの回答を提示できるようになる。こうしたクエリは、現在ではChatGPTとより関連づけられるかもしれない。
ChatGPTに質問すると、ニール・ゲイマンが「情報で形作られた文」と呼ぶ、説得力のある答えが返ってくる。異なる文化的・歴史的文脈が創造性の定義をどのように形作るか例を挙げるように頼んだところ、ChatGPTは時間と空間を超えた創造性の表現について、漠然としながらも一貫性のある10の例をすらすらと挙げた。しかし、創造性とオーストラリア先住民の「ドリームタイム」物語に関する知識の源泉を教えてくれるように頼んだところ、「AI言語モデルとして、私は書籍、記事、その他多様な分野や情報源の文書を含む、膨大なテキストデータセットで学習してきました…学習に使用した具体的な情報源に直接アクセスすることはできません」としか答えられなかった。そして、私が読むかもしれない本をいくつか挙げ始めたが、その多くは完全に創作されたものだ。生成AIは、Googleが医師ベースの検索に進出する上でまだ始まったばかりだが、図書館員にとって最後の一押しとなるかもしれない。
医師に本質的な欠陥はありません。ウサギの穴に飛び込むのは時間のかかる作業であり、信頼できる情報源であれば、理解の根源に到達するために文脈を捨て去る価値がある場合もあります。問題は、その医師が個人や集団ではなく、機械学習アルゴリズムのモノリシックな集合体である場合です。AIについて語る時、私たちが文脈に近づいたり遠ざかったりする速度は増幅され、生成テキストの三大騎士、つまり誤情報、経済的搾取、そして創造性の腐敗に同調することになります。これらはすべて、文脈の崩壊によって活性化され、深みへのアレルギー反応を抱くものです。
しかし、さらに恐ろしいのは、些細なことになってしまっている真実の、穏やかな終末だ。
百科事典の項目から得られるような、商品化可能な医師の真実というものがある。5つの異なるウェブページを訪問すれば、すべて同じ金の融点を教えてくれるだろう、といったものだ。しかし、他の種類の真実もある。それは、日常的な文脈における詩(詩ではないが、詩である)に内在する種類の真実だ。ウェブページの美的感覚、テキストの周囲の環境、そして書き手の声の中に真実がある。話し手の無意識の身振り、唇の痙攣の中に真実がある。言葉が舌の上で投げ出される感覚、字形の傾き、ペンの滑り、括弧(内の単語の量)の中に真実がある。リズムを中断する文章の断片の中に真実がある。
テキストは、その由来を知ることで変化します。どれだけの労力が費やされたかを知ることで変化します。読者は、雰囲気や音色に意味を見出します。それは、親が赤ちゃんが空腹で泣いているのか、恐怖で泣いているのか、それとも疲労で泣いているのかを見分けるのと同じです。あるいは、同じ歌でも違うキーで演奏されると、人の心は違ったように揺さぶられます。記憶にない夢から覚めても鋭い理解が持続するように、人間の創造性という雑然とした文脈と交わることで、曖昧さと深みをもって、いつまでも心に残る亡霊が生まれます。
幽霊とは、ティム・オブライエンが「起こっていることの真実よりも真実であることがある」物語の真実と呼んだものであり、オードリー・ロードは詩を「名前のないものに名前を与えて考えることができるようにする方法」と呼び、マギー・ネルソン(ウィトゲンシュタインを言い換えて)は、表現できないものが「表現されたものの中に、表現できない形で含まれている」と呼びました。
そして、この言葉では言い表せない詩的な物語の真実は、単なる知識を超越する。それは会話、アイデアの交換、批判的思考、セレンディピティ、そして正当に評価される労働の基盤となる。これらは、住民を思いやる思いやりのコミュニティ、そして知識という束の間の満足感のためにコミュニケーションの複雑な美しさを犠牲にしないインターネットへと融合していく粒子なのだ。
GoogleはChatGPTよりもコンテキストの提供に関心があるかもしれないという兆候があります。そして、少なくとも技術的な意味では、AIは確かに深みの方向への力となる可能性があります。しかし、Googleのビジネス上のインセンティブと検索履歴を考えると、私は懐疑的です。アナログの世界を個別のデジタル情報に分割することは、私たちがGoogle製品に費やす時間を増やすことを意味します。また、Googleの音声アシスタントなど、他のプラットフォームで情報を容易に再利用できるようになります。
別の世界では、Web クローラーは私たち自身のクロールの補助輪となり、言語処理アルゴリズムは厳密さを避けて「自然な」会話の豊かな意識の流れの質を実現し、検索エンジンは解決策の壁を差し控えて代わりにドアを提示することができます。
しかし、私はむしろ、アンサーボックスがGoogleの目指す未来を予感させるのではないかと懸念しています。目的地へと急がされ、旅は厭われ、リンクは招待ではなく義務としてのみ表示される未来です。ツールは、驚きを呼び起こすのではなく、私たちの驚きをまるで病気のように扱うようになるのではないかと懸念しています。これは、バルト的な作者の死だけでなく、人間が作った作品そのものの死、人間の言語がその模倣に置き換えられることを意味するのではないかと懸念しています。私たちは文脈の根絶に向かって突き進んでいるのではないかと懸念しています。
私たちはどんなテクノロジーの未来を望むのでしょうか?すべての答えを知っていると主張する未来でしょうか、それともより多くの疑問を投げかける未来でしょうか?アウトプットを優先する未来でしょうか、それともアクセシビリティを優先する未来でしょうか?人々を掘り出すべきデータセット、克服すべき非効率性と見なす未来でしょうか、それとも価値があり注目に値する未来でしょうか?
私たちが探し求めているものを正確に与えられたら、私たちは自分自身を見失ってしまうのでしょうか?