先週、1,000人以上が参加したバーチャルイベントとして開催されたアメリカクロスワードパズル大会で、ある素晴らしい参加者が話題になりました。(ちなみに私は143位でしたが、残念ながら私ではありませんでした。)AIが初めて、グリッドを埋めるスピードと正確さを競い合い、人間の解答者を上回るスコアを獲得しました。これは、ほぼ10年間、炭素ベースのクロスワードパズル解答者と競い合ってきたクロスワードパズル自動解答機「Dr. Fill」の勝利でした。
一部の観察者にとって、これはAIが優位に立つようになった人類の活動の単なる一つの分野に過ぎないと思われたかもしれない。フィル博士の功績をSlate誌で報じたオリバー・ローダーは、「チェッカー、バックギャモン、チェス、囲碁、ポーカーといったゲームは、機械の侵略を目の当たりにし、次々と支配的なAIに敗れてきた。今やクロスワードもそれに加わった」と記している。しかし、フィル博士がどのようにしてこの偉業を成し遂げたのかを見てみると、人間とコンピューターの最新の戦いという以上のものが明らかになる。
わずか10年ちょっと前、 IBMのワトソン・スーパーコンピューターがクイズ番組「Jeopardy!」でケン・ジェニングスとブラッド・ラターを打ち負かしたとき、ジェニングスは「私としては、新しいコンピューターの支配者を歓迎します」と答えた。しかし、ジェニングスが人類を代表して白旗を揚げるのは時期尚早だった。当時も今も、最新のAIの進歩は、自然言語のコンピューターによる理解の可能性だけでなく、その限界も示している。そしてフィル博士の場合、そのパフォーマンスは、クロスワードを解くという独特な言語的課題、つまりパズルを考案した発明家たちの知恵と知恵を競うという課題に人間が投入する知的兵器庫について、多くのことを教えてくれる。実際、ソフトウェアがいかにして厄介なクロスワードのヒントを解こうとしているかを詳しく見ると、私たちが言語で遊ぶときに脳が何をしているのかについて、新たな洞察が得られる。
Dr. Fillは、コンピューター科学者であり、クロスワードパズル作成者の著書も出版しているマット・ギンズバーグによって考案されました。2012年以来、ギンズバーグはDr. FillをACPTに非公式に登録し、毎年解法ソフトウェアを徐々に改良してきました。しかし今年、ギンズバーグはカリフォルニア大学バークレー校のダン・クライン教授が指導する大学院生と学部生で構成されるバークレー自然言語処理グループに加わりました。
クライン氏と学生たちは2月に本格的にプロジェクトに取り組み始め、その後、今年の大会に向けて協力できないかとギンズバーグ氏に連絡を取りました。ACPT開幕のわずか2週間前、彼らはバークレー校のグループがニューラルネットを用いてヒントを解釈する手法と、ギンズバーグ氏が開発したクロスワードパズルを効率的に埋めるコードを組み合わせたハイブリッドシステムを作り上げました。
(事後に ACPT パズルを解くことに興味がある人にはネタバレが含まれます。)
新しく改良されたDr. Fillは、グリッドをめまぐるしく埋めていきます(動作の様子はこちらでご覧いただけます)。しかし実際には、このプログラムは非常に体系的に動作し、ヒントを分析して回答候補のランキングリストを作成し、その後、他の回答との適合度などの要素に基づいて候補を絞り込みます。正しい回答は候補リストの奥深くに埋もれている場合もありますが、十分な文脈があれば、リストの一番上に浮かび上がってくることもあります。
フィル博士は、さまざまなメディアに掲載された過去のクロスワードから収集したデータでトレーニングされています。パズルを解くために、このプログラムは、すでに「見たことがある」手がかりと答えを参照します。人間と同様に、フィル博士は、新たな課題に直面したときには、過去に学習した内容を頼りにし、新旧の経験のつながりを探し出さなければなりません。たとえば、ウォール ストリート ジャーナルのクロスワード編集者であるマイク シェンク氏が作成したコンテストの 2 番目のパズルは、長い答えに -ITY の文字を追加して新しい独創的なフレーズを作成するというテーマに依存していました 。たとえば、OPIUM DENS は OPIUM DENSITY になります (手がかりは「ケシ製品の効力の要因?」)。フィル博士は幸運でした。珍しいフレーズにもかかわらず、答えのいくつかは、ギンズバーグが 800 万を超える手がかりと答えのデータベースに含めた、2010 年にロサンゼルス タイムズに掲載された同様のテーマのクロスワードに登場していたからです。しかし、トーナメントのクロスワードパズルのヒントは大きく異なっていたため、フィル博士は依然として正解を見つけるのに苦労しました。(例えば、「アヘンの濃度」は2010年には「近隣の麻薬取引量の指標?」というヒントが出ていました。)
ダン・クライン提供
パズルのテーマの一部であるかどうかにかかわらず、すべての答えについて、プログラムは数千もの可能性を検討し、手がかりに最も一致する候補を生成します。候補を尤度順にランク付けし、縦横の要素がどのように連動するかといったグリッドの制約と照らし合わせます。最有力候補が正解である場合もあります。例えば、「imposing groups(印象的なグループ)」という手がかりに対して、フィル博士は正解である「ARRAYS(配列)」を推奨語としてランク付けしました。「imposing(印象的な)」という単語は、この単語の以前の手がかりには一度も登場していませんでしたが、「impressive(印象的な)」などの同義語は登場していたため、フィル博士は意味的なつながりを推測することができました。

ダン・クライン提供
文字に横線を引くと候補を絞り込むのに役立つことが多く、5 文字の答えで「ああ、残念だ!」とヒントが出た場合、2 番目の文字が O であることが分かれば、正解の SO SAD がリストの一番上に浮かび上がります。

ダン・クライン提供
クロスワードパズル解答システムは閉鎖的なシステムであり、答えをGoogleで検索するだけでは不十分です。そのため、知識ベースには欠落が存在します。この点においても、このプログラムは人間の不完全な思考能力を模倣しています。たとえその記憶容量と処理速度が人間の貧弱な脳をはるかに凌駕するとしてもです。「『ジェリクル・キャッツは陽気で明るい』を書いた詩人」(5文字)というヒントは、T・S・エリオットのファンならすぐに思いつくかもしれませんが、フィル博士は当初、問題の詩人としてエリオットよりもキーツとイェイツを好んでいました。(バークレーチームのヒント解答システムは、事後的に解釈できるものではなく、「ブラックボックス」アプローチを採用しているため、なぜ特定の詩人を優先するのかを説明するのは難しい場合があります。)

ダン・クライン提供
そして、しゃれや言葉遊びを含む手がかりになると、事態は特にややこしくなります。こうした手がかりには、通常、疑問符が付きます。このパズルで、PERISCOPE は「Sub standard?」という手がかりを受け取りましたが、フィル博士は最初困惑しました。最有力候補は「sub」がサンドイッチに関係していると考えたため、「TUNA ON RYE」のような候補を出したのです。しかし、こうした間違った勘でさえも啓発的です。バークレーのニューラルネットシステムは、疑問符付き手がかりが間違った種類の潜水艦に引っかかっても、何か異常なことが起きていると認識できたのです。クライン氏によると、このプログラムは疑問符が何らかの意味上のごまかしを示すことを明示的に教えられたわけではありませんが、機械学習を通じて、通常のヒントよりも直接的ではない選択肢を探す必要があることを徐々に推測できるようになります。
しかし最終的に、フィル博士はクロスワードパズルを1分未満で正解しました。これは、他のどの人間の解答者よりも2分も速い時間でした。しかし、200人以上の人間の解答者とは異なり、フィル博士はすべてのパズルを完璧に解けたわけではありませんでした。2つのパズルで行き詰まり、エラーで終了しました。得点ペナルティがあったにもかかわらず、フィル博士の驚異的なスピードは、7問解答時点でリーダーボードのトップの座を維持するのに十分なもので、最速の人間の解答者を僅差で上回りました。
1978年の創設以来、毎年恒例のトーナメントを監督してきたニューヨークタイムズのクロスワード編集者ウィル・ショーツ氏は、今年のトーナメントの問題は「すべての答えが左から右、上から下に読んでも理解できる英語だった」ため、フィル博士の強みを生かしたかもしれないと指摘した(解答をグリッドに入力する方法で遊ぶ、厄介な問題が出る年もある)。ショーツ氏は、「フィル博士が難しく、時には引っ掛けるクロスワードを非常にうまく解けるようにプログラムした創意工夫には畏敬の念を抱いている」と語るが、チームカーボンには依然として多くの点で優位性があると考えている。「今のところ、クロスワードのような厄介で非論理的な現実世界の問題への対処は、人間の方がまだ得意です」とショーツ氏は言い、余分な滑りやすさがないパズルでも、フィル博士は人間が決してしないような方法でつまずくことがあるという事実を指摘した。
トーナメントのスコアボードでトップを争うレースは最も注目を集めましたが、ギンズバーグ氏とバークレーチームの共同作業には、それほど注目を集めない別の成果もあるかもしれません。一つには、機械学習が進歩し、プログラムにさらに多くのパズルとトレーニングデータが投入されるにつれて、フィル博士は今後数年間でより素晴らしい成績を残す可能性が高いでしょう。しかし、クライン氏は、自然言語処理の分野でしばしば発生する多くの課題を目の当たりにしています。例えば、人間の脳はしばしば「マルチホップ推論」と呼ばれる、異なる知識の断片を推論の連鎖の中で組み合わせる手法を用いています。AIにこのような論理の飛躍を教えるということは、人々が言語の中に、間接的であったり、全く誤解を招くような意味を見出す微妙な方法を示唆しています。同様に、フィル博士が「サブ」というヒントを理解できなかったことからもわかるように、AIの脳は、あまり一般的ではない代替の意味を認識するのに依然として苦労しています。私が最近共同で解いたニューヨーク・タイムズのクロスワードパズルのヒントにある、このミスディレクションを考えてみてください。「ある意味でキングのような」答えはMACABRE(マカブレ)。ここでの「キング」は小説家スティーブン・キングのことだから。もしAIがこんなヒントを解けるなら、私は新しいコンピューターの支配者を歓迎する準備が整うかもしれない。
クライン氏は、フィル博士のパフォーマンスは、私たちがいかにして最も難解なクロスワードパズルのヒントから意味を解き明かすことができるかを理解する第一歩に過ぎないと考えている。そして、推論の連鎖を伴うような、特に巧妙な言語的事例に関しては、「人間を困惑させるものは、この種のシステムにとってさらに困惑させる可能性が高い」とクライン氏は述べている。クロスワードパズルは、言語が単なる単純なコミュニケーションではないことを示すものであり、AIにとって今後も独自の課題を提示し続けるだろう。言語の作用に心地よく戸惑うことは、人間の本質的な性質なのだ。
WIREDのその他の素晴らしい記事
- 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
- マクドナルドのアイスクリームマシンのハッキングをめぐる冷戦
- タコの夢が睡眠の進化について教えてくれること
- 怠け者のゲーマーのためのケーブル管理ガイド
- パスワードなしでデバイスにログインする方法
- 助けて!同僚と情報をシェアしすぎていませんか?
- 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
- 🎮 WIRED Games: 最新のヒントやレビューなどを入手
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください