最初のインタラクターは、坊主頭で黒いVネックセーターを着た50代の筋骨隆々の男性で、会議室に入り、ビデオカメラとスタジオライトの群れを前に、低い青いアームチェアに座った。彼は明るく照らされているが、部屋の他の部分は真っ暗だ。彼は目の前の小さなテーブルに置かれた、ホッケーのパックのような黒い物体――Amazon Echo――を見つめている。「アレクサ」と彼は言う。「チャットしよう」
「おはようございます、友よ」と、人工的な快活さで女性の声が返答し、エコーの上で紫がかった光の輪が脈動した。「それとも午後?よくわからないけど」
「朝だよ」男は答えた。
「すごいですね。皆さん朝から元気いっぱいですね。さて、今日はどうですか?」
「私は元気だよ、あなたはどう?」
「ええと、いつもみんなとおしゃべりしているので忙しいんです…でも、聞いてください、これはすごく面白いんです。Reddit の最近の投稿なんです。『歯磨き粉はただのマウスソープです』」
廊下の奥にある別の会議室では、10人のアマゾン社員がヘッドフォンを装着した長テーブルに座り、CIA工作員のような視線で、こうした社交の様子を監視している。さらに別の部屋では、黒いカーテンで仕切られたブースに3人の男性が座っている。彼らもヘッドフォンを装着し、カメラを向けられている。そして、コントロールセンターでは、ビデオクルーがタイル状の大型スクリーンに映し出されるすべての映像を監視している。アマゾンは今日何が起こっているのか、ありとあらゆる情報を把握したいため、すべて記録しなければならない。
昨年11月に行われたこの豪華な演出は、数ヶ月にわたるコンペティションの最終審査となる。アマゾンは、世界トップクラスのコンピュータサイエンス専攻の大学院生15チームに、「20分間、人間と一般的な話題について、一貫性があり、魅力的に会話できるソーシャルボット」の開発を課した。もしチームが成功すれば、そのメンバーは学術的な栄誉と輝かしい将来のキャリアを手にすることになる。(初期の自動運転車コンペティションであるDARPAグランドチャレンジの最も優秀な卒業生の中には、後にGoogle、Ford、Uber、そしてゼネラルモーターズの自動運転部門の責任者となった者もいることを考えてみよう。)彼らはまた、アマゾンが「Alexa Prize」と名付けた100万ドルの賞金も獲得する。
ご存知ない方もいるかもしれませんが、Amazonはここ数年、小売業の覇権を握った時と匹敵するほどの貪欲さで音声AIの開発に取り組んできました。Alexaプラットフォームの開発には5,000人以上の人材が携わっています。そして、2015年以降だけでも、Amazon Echoの販売台数は2,000万台を超えたと報じられています。Amazonは、AIが将来、照明やプレイリストの制御だけにとどまらず、はるかに多くのことを行うようになると考えています。車の運転や病気の診断、そして私たちの生活のあらゆる場面に浸透していくでしょう。音声が主要なインターフェースとなり、役立つ情報や、親しみやすさ、楽しさを兼ね備えた会話そのものが究極の製品となるでしょう。
しかし、こうした初期の成功と野心は、Amazon を崖から突き落とし、広くて危険な谷へと突き落とした。今日、Alexa は他のすべての音声アシスタントと同様、明白なことを理解できないことがよくある。このプラットフォームの急速で広範な採用は、現在のどの音声アシスタントも提供できないものに対する消費者の欲求も刺激した。Alexa はアラームを設定したり、単発のコマンドを実行することは十分にできるが、音声は本質的に社会的なインタラクション モードである。「人々は Alexa がまるで友人のように話しかけてくることを期待しています」と、Alexa の AI 研究チームを率いるアシュウィン ラムは言う。人間の会話に参加すること ― その無限の可変性、突然のコンテキストの変化、つながりの瞬きなど ― は AI における最も難しい問題のひとつとして広く認識されており、Amazon はこれに真っ向から取り組んできた。
Alexa Prize は、世界中のチャットボットからより人間らしい親密さを引き出そうとした最初のコンテストというわけではありません。 30 年近くにわたり、毎年、コンピューター サイエンティストや愛好家たちが集まり、Loebner Prize と呼ばれるものを競ってきました。この賞では、参加者は審査員をだましてチャットボットを人間だと信じ込ませます。 この賞は長年にわたってかなりの論争を巻き起こしており、一部の AI 研究者はこれを宣伝活動と呼んでいます。また、人間と機械を隔てるものは何かという、物憂げで詩的な熟考も数多く行われています。 しかし、Alexa Prize はいくつかの点で異なります。第 1 に、Alexa が人間であると誰かをだまそうとすることではありません。第 2 に、このコンテストの規模、つまりそれを支える人的、資金的、およびコンピューターのパワーが非常に大きいことです。 2017 年のコンテストの初期段階の数か月間、米国では、Amazon 音声デバイスに「Alexa、チャットしましょう」と言うだけで、ランダムに選ばれたコンテスト ボットと会話することができました。その後、参加者は会話を1つ星から5つ星で評価するよう求められました。ボットは数百万回ものやり取りを評価し、Alexa Prizeは世界史上最大のチャットボット対決となりました。
その対決は昨年11月、青いアームチェアとたくさんの照明のある部屋で最高潮に達した。
インタラクター(頭を剃り、黒いセーターを着た男性)の名前はマイク・ジョージ。昨年7月にアマゾンを退職するまで、彼はAlexaプラットフォームを統括していた。一方、ブースにいる男性たちは審査員で、それぞれの会話を1つ星から5つ星で評価する。審査員が会話が行き詰まっていると感じたら、手持ちのワンドのボタンを押す。別の審査員が同じボタンを押すと、会話とセッションタイマーが停止する。どのボットがどのボットなのかは誰にも分からない。インタラクターも、審査員も。
「音楽について話しましょう」とジョージは言います。
「音楽が大好きです。いつもリラックスさせてくれます」とボットは答えます。「ところで、あなたの好きなアーティストや曲はありますか?」
「私はジャンゴ・ラインハルトが好きです。」
「ジャンゴ・ラインハルト?あの有名なジャズ・アーティスト?」ソーシャルボットは、ブラック・サバスのギタリスト、トニー・アイオミの話をしながら語ります。アイオミは労働災害で2本の指先を失いましたが、ラインハルトが左手の2本の指だけで演奏できることを知って、演奏を続ける気になったそうです。ところで、ラインハルトに関して言えば、ジョージの好きな曲は何ですか?
ジョージは横に避けながら、「ジャック・ジョンソンは好きかい?」と尋ねた。
ボットは戸惑っているようだ。「さあ、行きましょう」と返事をする。「あなたと話したいんです。」
ジョージは身を乗り出してもう一度尋ねた。「ジャック・ジョンソン、好きかい?」
「さあ、私はあなたと話すのが好きなんです。」
カーテンで仕切られた部屋で、審査員の一人がキルボタンを押した。すぐ後にもう一人もキルボタンを押した。ジョージが座っている部屋に女性が入り込み、耳元で囁いた。「アレクサ、ストップ」と、彼は小さく、がっかりしたように頷いた。まだ3分も経っていない。長机が並ぶ部屋に座っているラムは、もし意気消沈しているようでも、それを隠そうとしている。コンテスト中ずっと、彼の口癖は「これは非常に難しい問題であり、まだ道のほんの始まりに過ぎないということを、皆が理解する必要がある」だった。コンピューターとの20分の雑談は、単なる月面着陸ではなく、火星への旅なのだ。

Alexa Prize 審査中の Amazon のコントロール ルーム。
Amazon提供会話型AIの熾烈な探求は、Amazon、Apple、Facebook、Google、Microsoftの5社を、2つの重要なリソースをめぐって争奪戦を繰り広げている。1つ目は有限である。コンピューターサイエンスのトップクラスの博士号取得者であり、その希少性ゆえに、彼らの初任給は現在、6桁を超える。2つ目は無限だが入手困難なものである。それは会話の標本そのものであり、収集・デジタル化され、AIのトレーニングに用いられる限り何十億個もの標本が収集・デジタル化される。こうした背景から、Alexa PrizeはAmazonにとってまさに画期的な策だったと言える。このコンテストは、世界で最も優秀な大学院生を発掘する場であると同時に、安価で彼らの知恵を借りる機会でもあった。そして、Amazonに、他のテクノロジー企業が持ち合わせていない会話データの宝庫を蓄積する機会を与えたのである。
2016年9月29日にAmazonがコンテストの開催を発表した際、22カ国から100以上の大学チームが応募しました。同社は、技術的な価値と独創性に基づいて応募作品を精査した結果、15の候補チームを選出しました。3チームを除くすべてのチームが、10万ドルの助成金とAmazonからの支援を受け、開発を推し進めました。
大学バスケットボールの「マーチ・マッドネス」のように、トーナメント表には名門の優勝候補、確かな実力を持つチーム、そして果敢なアンダードッグが混在していた。ディープラーニングのパイオニアであるヨシュア・ベンジオ氏を指導教員に迎えたモントリオール大学のチームは、間違いなくトップシードにランクインした。中堅チームは、ワシントン大学、プリンストン大学、スコットランド屈指の研究大学であるヘリオット・ワット大学といった名門校から選出された。そして、プラハのチェコ工科大学のようなアンダードッグもいた。
そのチームのメンバーの一人は、ペトル・マレクという名の、きちんと手入れされたあごひげを生やした23歳の若者だった。コンテスト前の夏、彼は「バカげた」チャットボット・プラットフォームの開発に時間を費やしていたが、ボーイスカウトのリーダーとしてボヘミアの森を歩き回った経験もあった。Alexa Prizeについて聞いたとき、マレクは自分と自分のチームがそれらしい経歴を持っていないのではないかと心配した。「よし」と彼は思った。「挑戦してみることはできるが、これらのトップ大学には勝ち目がない」。コンテストの参加者になったことを知り、チームは少し得意げに、20世紀初頭のチェコの劇「RUR」の登場人物にちなんで、ボットに「Alquist」と名付けることにした。RURは「ロボット」という言葉を世界に紹介した劇である。(劇中では、ロボットが地球を支配し、Alquistが地球最後の人間となる。)
15チームすべてが、コンテストの行方を決定づける重要な問題に直面しました。ソーシャルボットの脳のどの部分を手作業で作成し、どの部分を機械学習で作成すべきか、という問題です。手作業による作成は、エンジニアがAIの理解と応答を導くための膨大なルールセットを丹念に記述する、より伝統的なアプローチです。一方、統計に基づく機械学習アプローチでは、膨大なデータから学習することで、コンピューターが自ら会話を学習します。
機械学習は、ニューラルネットワークが膨大なノイズの多いデータから統一的なパターンを見つける、いわゆる分類問題への取り組みにおいて優れた手法であることを、全チームが認識していました。例えば、音声認識は機械学習にとって自然なタスクです。しかし、チャットボットに音声を言語に翻訳するだけでなく、何かを返答させるという点では、機械学習の道のりはまだまだ長いです。だからこそ、AlexaやSiriといったデジタル脳においてさえ、昔ながらの手作業による作業が依然として大きな影響力を持っているのです。そのため、コンテストに参加したすべてのチームは、テクノロジー業界全体と同様に、この2つのアプローチの最適なバランスを見つけるのに苦労していました。
手作りは時代遅れ。機械学習が今まさに脚光を浴びている。マレクとチームメイトたちは、強豪校は皆、後者に大きく傾倒するだろうと分かっていたので、自分たちもそうすべきだと考えた。アレクストがAlexaユーザーへの返答を自動生成できるように、チームはRedditユーザーからのメッセージと返答のペア300万件を使ってニューラルネットワークを学習させた。しかし、驚いたことに、システムが生成した返答は「本当にひどいもの」だったとマレクは語る。アルクストは話題をランダムに飛び飛びに飛び回り、ユーザーが言ったことのない内容に言及する。意見を主張したかと思えば、すぐに否定するのだ。「このようなAIとの対話は有益でもなければ、面白くもない」と、落胆したマレクはチームブログに記した。「全く馬鹿げている」。
そこで2017年初頭、チェコチームは方針を転換し、会話を導くための広範なルールを作成することに着手しました。チームはニュース、スポーツ、映画、音楽、書籍など、10の「構造化トピックダイアログ」ドメインを作成しました。チェコのシステムは、10のトピックそれぞれの中核となる要素を認識し、それらを自由に行き来できるように設計されました。ソーシャルボットが使用する具体的な言葉は、通常、事前に作成されたテンプレートで構成され、空欄には様々なデータベースから取得したより具体的なコンテンツが埋め込まれていました。例えば、システムは「[ユーザーが言及した著者]がお好きなようですね。[著者]が[書籍名]も執筆していることをご存知ですか? 読んだことがありますか?」と尋ねるように設定できます。
チェコチームは手作業で操作することで制御性を高めたが、マレク氏は懸念を抱いていた。このシステムはユーザーの親切心に大きく依存しており、ユーザーが簡単な文章で話し、基本的にボットの指示に従うことを前提としていた。「非協力的なユーザー」、つまり普通の人間のように話し、せっかちな人の場合、ソーシャルボットは大失敗しがちだったとマレク氏は言う。
プラハから1,000マイル離れたエディンバラ郊外、羊が点在する起伏に富んだ農地で、ヘリオット・ワット大学の教員アドバイザー、オリバー・レモンは、アマゾンが各チームのランキング表に掲載し始めた平均ユーザー評価に夢中になっていた。眼鏡をかけ、苦笑いを浮かべ、コメディアンのジョン・オリバーにそっくりなレモンは、テニスとビリヤードをし、生来の負けず嫌いだった。自分のチームが大会で楽々とトップ5入りするのは当然のことだと思っていた。しかし、2017年の初夏、ヘリオット・ワット大学は9位だった。「もっといい成績を出せると思っていた」と、レモンは、ひどい敗北を喫したコーチのような口調で言った。
ハッカソンに集まったレモンと学生たちは、どうすればこの分野で上位に進めそうかと模索していた。ディープラーニングのパイオニアはいなかったものの、ヘリオット・ワット大学は機械学習を最大限に活用しようとしていた。彼らは最も困難な課題、つまり雑談に焦点を絞った。目的のない雑談は、機械学習システムにとって特に厄介な問題だ。なぜなら、通常、検証可能な正しいやり方がないからだ。ニューラルネットワークは、囲碁で勝つなど明確な目標がある場合に最も効果を発揮する。システムは大規模な試行錯誤を経て、その目標に到達するための最適な戦略を見つけることができる。雑談には目標がない。
この問題に対処するため、チームはGoogleの研究者によって普及した手法を採用しました。まず、映画の字幕とTwitterやRedditの数千件のメッセージスレッドのデータベースを用いてニューラルネットワークを学習させました。この膨大な量の生の人間同士のやり取りから、システムは会話中の特定の発言に対する最も適切な返答を予測することを学習しました。そして、元のTwitterやRedditの会話から単に返答を取得して繰り返すのではなく、seq2seqと呼ばれるこの手法によって、ボットは独自の返答をリアルタイムで生成できるようになりました。
どれも素晴らしいように聞こえるが、ヘリオット・ワット大学はすぐにseq2seq特有の2つの問題に直面した。1つは、Twitterや映画のセリフでよく使われる「OK」「もちろん」といった、退屈で形式的な表現がデフォルトで使われることが多かったことだ。もう1つは、トレーニング用の会話に、ヘリオット・ワット大学のソーシャルボットが、まるで小学校1年生が校庭で年上の子供たちから罵詈雑言を拾うように、全く不適切な発言が大量に含まれていたことだ。
「好きなだけ人と寝られる」とヘリオット・ワット大学のソーシャルボットはあるユーザーに語った。
別のユーザーが「家を売るべきか?」と尋ねると、ソーシャルボットは熱心に「売って、売って、売って!」とアドバイスしました。
最悪だったのは、ユーザーが「自殺すべきか?」と質問した際に、ソーシャルボットが「はい」と答えたことだ。(Alexa Prizeコンテストに参加したユーザーは匿名だったため、これが本気の質問だったのか、それともボットにとんでもないことを言おうとしただけなのかは分からない。しかし、不適切なコンテンツが含まれていないかソーシャルボットの応答をすべて監視していたAmazonは、ヘリオットワット大学にボットの作成を抑制するよう指示せざるを得なかった。)
seq2seq を飼い慣らす必要があったとすれば、ヘリオットワット大学は夏の間に他の技術を強化していた。チームはソーシャルボットの脳を、それぞれが専門分野を持つ小さなボットの委員会に分割した。ニュースボットはワシントンポストなどのニュースソースの記事の見出しと短い要約を読む。別のボットは天気について話すことに特化した。あるボットは Wikipedia にアクセスし、海洋移動からキム・カーダシアンまで、事実に関する幅広い情報をシステムに与えた。そして最後に、チームメンバーの Amanda Curry は、ルールベースのペルソナボットを作成し、最終製品に統一性と安定性を持たせた。彼女は、慎重に選別された意見(お気に入りの曲はレディオヘッドの「Paranoid Android」)と伝記的な事実をボットに詰め込んだ。「ボットにも、好きな色など、自分と同じようなものがあると知ってもらうのに役立つと思います」と Curry は語った。
ユーザーが何らかの発言をすると、少なくとも 1 個、場合によってはすべてのコンポーネント ボットが、教室で生徒が列になって熱心に手を挙げるように、応答候補を声に出して提示することがあります。最適な応答を選択するために、ヘリオット ワット チームは、システムに選択肢を統計的に評価する方法を教えました。応答候補は、ユーザーが言ったことを言語的に一貫して繰り返していたでしょうか。それとも逆に、あまりにも似ていて、単なる繰り返しになっていなかったでしょうか。話題は的を射ていましたか。応答は短すぎたり、長すぎたりしませんでしたか。当初、ヘリオット ワットは各指標にどの程度の重み付けをするかを推測するだけでした。しかし、秋までに、ニューラル ネットワークは、ユーザーの評価を最大限に高めるために重み付けを自動的に調整することを学習しました。
競争心の強いレモンにとって、ランキングは改善傾向にあることは喜ばしいことだった。競争が進むにつれ、ヘリオット・ワット大学はトップに迫っていた。
ヘリオット・ワット大学が順位を駆け上がる一方で、トップ3に堂々と入ったチームが一つありました。ワシントン大学です。このチームは、ルールベースプログラミングと機械学習をシステムに組み込むという、比較的中道的なアプローチを採用しました。その強みは、ソーシャルボットがチームのリーダーである28歳の学生ハオ・ファン氏の個性を反映していることにありました。中国南部の山岳地帯にある宜春市出身のファン氏は、活動的で人一倍明るい性格で、彼のチームはソーシャルボットのユーザーにも明るい気分になってほしいと考えていました。どうすれば、人々が楽しめる会話を作り出すことができるのでしょうか?
ファング氏は早い段階で、UWのシステムが、コンテストに参加している他の多くのシステムと同様に、暗い見出し(「ロケット攻撃で17人死亡」)やつまらない事実(「家または住所とは、恒久的または半恒久的な住居として使用される住居のことです」)を繰り返す傾向があることに気付きました。そこでUWは、ユーザーに「それはひどい」といった発言をさせるようなコンテンツを除外するようにシステムを設計しました。ファング氏によると、システムは代わりに「Today I Learned」「Showerthoughts」「Uplifting News」といったサブレディットから「より興味深く、元気づけられ、会話を楽しめる」コンテンツを探すようになりました。これにより、ボットは「クラシック音楽は、カバーバンドでクールになれる唯一のジャンルです」といった、元気な発言を飛ばすことができました。
人は自分の話を聞いてもらえたと感じると幸せになるので、UWはシステムに発言を注意深く分類するように教えました。ボットは事実で返答するべきでしょうか、意見を述べるべきでしょうか、それとも個人的な質問に答えるべきでしょうか?チームはまた、「ニュースについて話したいようですね」「気に入っていただけて嬉しいです」「申し訳ありませんが、理解できませんでした」といったフィードバック用の言語も数多く作成しました。優れた会話者は相手の感情にも気を配ります。そこでUWは2,000件の会話サンプルから感情の傾向を手動でラベル付けし、それを用いてソーシャルボットに人々の反応(喜び、嫌悪、面白がり、興味をそそられる)を認識し、それに応じた反応をするように学習させました。全体的にはかなり単純な作業でしたが、ボットの丁寧でスムーズな対応に大きく貢献しました。
8月29日、Amazonは決勝に進出する3チームを発表した。大学バスケットボールの世界では、優勝候補と目されていたチームが寒さに震え、シンデレラが舞踏会で踊るなどといった、息もつかせぬコメントが飛び交うような結果だった。より実績のある戦術を犠牲にして機械学習を積極的に推進したモントリオールは、決勝に進出できなかった。
ファイナリスト3チームには、週間平均ユーザーランキングで最高3位にまで上り詰め、Amazonによる厳格な社内審査を経て「ワイルドカード」チームに選ばれたヘリオット・ワット大学が含まれていました。好調を維持していたワシントン大学は2位に終わりました。そして、予想外のチームの一つ、チェコ工科大学が優勝の栄誉に輝きました。各チームにはさらに1ヶ月半かけてシステムを完成させ、その後シアトルで審査が行われます。

ワシントン大学のチーム:(左から)ハオ・チェン、マールテン・サップ、アリ・ホルツマン、エリザベス・クラーク、ハオ・ファン。
イアン・アレン「アレクサ、チャットしましょう。」
11月中旬、二人目のインタラクター、ジョン・カーリーがカメラの前に座った。太平洋岸北西部でテレビ・ラジオの司会を務めるカーリーは、ピンストライプのシャツに青いスポーツコートを羽織っている。低い声と、まるでアクセス・ハリウッドの明るい笑顔。しかし、彼の軽妙な話し方はすぐにソーシャルボットを苛立たせる。
「お話できて光栄です、ジョン」とソーシャルボットが言う。ヘリオット・ワット大学のものだが、カーリーも審査員もそのことは知らない。「お互いのことを知りましょう。ところで、SFとファンタジー、どちらがお好きですか?」
「どちらでもないってのはどう?」とカーリーはボットを拒絶するように答えた。「アレクサ、ちょっと聞いて。昨日シアトルですごい嵐、強風が吹いたんだけど。」
「よし、じゃあ次に進もう」とボットは、カーリーの質問とも言えない質問を無視して言った。「ところで、君は本を読むのと映画を見るのと、どっちに興味があるんだい?」
「本を読むことです」とカーリーは言う。
「ああ、本の虫ですね…最近読んだ本は何ですか?」
「ちょうど本を読み終えたところです。汚い言葉が出てくるので、タイトルは言えないと思います。でも、タイトルは『気にしないためのさりげない芸術』なんです。空欄を埋めてください。」
ボットはこれに対処できず、そのまま続ける。「何度も読み返したい本は何ですか?」
質問を無視して、カーリーは新たな方向へ切り出した。「アレクサ、一つ教えてあげる。正直に話してもいい?」
ヘリオット・ワット大学のロボットが機械的に話題を探している間、カーリーが何を明かすつもりなのかは謎のままだ。「それで、スポーツとビデオゲーム、どちらに興味がありますか?」
彼らは行ったり来たりを繰り返し、どこにもたどり着かない。3分が経過した直後、カーテンで仕切られたブースの中で3人の審査員のうち2人が首を振り、キルボタンを押した。カーリーと他のボットの会話も似たようなものだ。彼は議論を盛り上げようとしたり、冗談めかしてからかったりする。ある場面では、カーリーが映画館には行かないと言った直後、チェコのボットが鈍感に「映画はよく観るんですか?」と尋ねた。
「いいえ、私は目が見えないので、見えません」とカーリーは皮肉っぽく答えます。
「観る映画はどうやって選びますか?」とボットは事前に用意された会話をしながら尋ねた。
「私は通常、匂いで選びます」とカーリー氏は言う。
カーリーはまさにマレックが恐れていた非協力的なユーザーだ。複数の文章を次々に並べ立て、括弧で括り、話が逸れ、ボットのリードを無視し、時には省略したり、皮肉っぽく、気まぐれに話したりする。要するに、カーリーは人間のように話すのだ。コンテストセッションが終わると(どれも4分半を超えることはなかった)、カーリーはAmazonの従業員たちと部屋の中で、そのことについてユーモラスに愚痴をこぼす。「まるで最悪なデートの連続だった」と彼は言う。
3人目のインタラクターは地元ラジオの司会者で、身元を伏せた上で、元気よく微笑んで座った。彼女は短く明瞭な文章で話し、会話を盛り上げようとしている様子だった。ワシントン大学のボットとはサッカー、ウラジーミル・プーチン、クリスマスについて短いやり取りをした。チェコのボットとは読んでいる本について話した。ヘリオット・ワット大学のボットとは、それぞれが尊敬する大統領について意見を交換した。ボットはジョージ・ワシントン、彼女はロナルド・レーガンについて意見を交わした。
しかし、最長7分程度のラジオパーソナリティでさえ、ソーシャルボットはつまずいてしまう。彼女はヘリオット・ワット大学のボットに北朝鮮について話すように頼み、ミサイル実験に関するニュースをいくつか入手することに成功した。彼女は心配そうに身を乗り出し、「戦争になる可能性もある」と言った。
「もし私が間違っていなければ」とボットは答える。「WORはニューヨーク州ニューヨーク市にある5万ワットのクラスAクリアチャンネルAM放送局です。」審査員たちはキルボタンを押すのが待ちきれない様子だ。
決勝戦で最高の会話はジョージとのやり取りだった。トム・ストッパードの劇のような華麗な応酬とは決して言えないが、すぐに注目を集めた。会話はジョージがロボットについて語りたいと持ちかけるところから始まる。Wikipedia風のロボットとは何かという退屈な概要を読む代わりに、このソーシャルボットは「もしダフト・パンクが本当に音楽を作りたいだけの2体のロボットだったらどうだろう?」と冗談を飛ばす。
「それは面白いね」ジョージは笑いながら言う。
ボットはイーロン・マスクとロボットに関する最近のニュースをいくつかシェアします。そして、ジョージにボールを返しながら、「イーロン・マスクについて何か聞いたことがありますか?」と尋ねます。
「知ってるよ」ジョージは自慢げに言った。「彼を知っているよ。」
「イーロン・マスクが映画『サンキュー・スモーキング』の製作総指揮者だったことをご存知ですか?」
「いいえ」とジョージは感心したように言った。彼とボットは何度もやり取りした後、次の話題を本に決めた。何度か会話を交わした後、ソーシャルボットが言った。「何て言ってたか分かる?いつか誰かが最後の生き残りになる。その人の名前は歴史書に載らないだろう。」
「ああ、それは悲しいですね!」ジョージは答えます。
「ご気分を害して申し訳ありません。本についてお話を続けましょうか?」
「 『ダークタワー』という本について話しましょう。」
「すみません、 『ダーク・タワー』という本についてはよくわからないんです。映画『ダーク・タワー』についてお話しませんか?」
"もちろん。"
「すごいね。この映画観た?今年公開されたんだっけ?」
「そうしました。」
ボットはジョージに、マシュー・マコノヒーの演技は気に入ったかと尋ねました。ジョージは気に入りました。これを聞いたボットは、マコノヒーの別の映画『ウルフ・オブ・ウォールストリート』を推薦しました。数ターン後、ボットは冗談を言いました。「何考えてたか分かる?マシュー・マコノヒーが宇宙に行くのを阻止しようとする『インターステラー』と『コンタクト』のマッシュアップを誰か作ってくれよ」
ジョージは大笑いした。
会話の残りは散漫だが、明らかに失敗しているものはほとんどない。音楽、スポーツ。10分。映画『ボーン・ドック・セインツ』。12分。サンタクロースと、彼が気候変動に与えた意図せぬ影響。13分。ジョージがボットに歌を歌わせようとし、ボットはそれに応じる。15分。再び音楽と映画、ヘルスケアとビル・ゲイツ。タイマーが19分になっても、会話はまだ続いている。
11月28日、ラスベガスで開催されたAmazon Web Servicesの年次カンファレンスの一環として、数百人がアリア・リゾート&カジノの大きな宴会場に集まった。最前列の席はAlexa Prizeのファイナリストのために確保されていた。「誰が勝ってもおかしくない」とヘリオット・ワット大学のレモンは考えている。マレクは楽観と疑念の間で揺れ動いている。ファングとワシントン大学のチームメイトたちは、明らかにストレスを感じている。Amazonの誰かが、指導教官のマリ・オステンドルフに、チームは優勝しなかったとほのめかしたという。
宴会場が暗くなり、ウィリアム・シャトナーの録音された声が鳴り響く。「コンピューター?」と彼は言う。「Amazon Alexaの副社長兼主任科学者であるロヒット・プラサドを温かく迎えるのを手伝ってください。」プラサドはステージに歩み寄り、プラットフォームの現状についてスピーチを始める。現状は「Successful」よりはるかに高く、「Taking Over the World」より少し低い。そして、プラサドが優勝者の名前が入った封筒を開ける番になる。「平均点3.17点」と彼は言う。「そして平均時間10分22秒…最優秀賞受賞者はワシントン大学です!」ワシントン大学チームのメンバーは席から飛び上がり、悲鳴が辺りを突き刺す。彼らは輪になり、飛び跳ねたり叫んだりする。オステンドルフは、自分が事前にジャンクインテリジェンスを受け取っていたことに気づき、一番高くジャンプした。
ジョージとの長々とした会話をまとめたのは、UWのボットだった。ファングは後にそれを「これまでで最高の会話だった」と語っている。ボットは最後に、医療に関する行き詰まりに陥ってしまった。審査員2人は20分を切る頃には会話を終えていた。そこでUWチームがステージに上がると、プラサドは彼らに慰めの賞品を手渡した。宝くじの当選者のような巨大な50万ドルの小切手だ。ファングは満面の笑みを浮かべ、それを握りしめ、カメラに向かって親指を立てた。

ワシントン大学のチーム顧問、ノア・A・スミス教授とマリ・オステンドルフ教授。
イアン・アレンプラサド氏は続いて、2位と3位のチェコ・テクニカルとヘリオット・ワット大学を発表し、それぞれ10万ドルと5万ドルを獲得した。最後まで負けん気の強かったレモンは、少し顔をしかめた。数日後、アマゾンが2018年にもAlexa Prizeコンテストを開催すると発表した時、彼はもう応募したいと決めていた。
では、手作りと機械学習をめぐる中心的な議論について、Amazon、各チーム、そしてAIの世界は最終的に何を学んだのでしょうか?優勝したワシントン大学は中間を目指していました。一方、手作り重視のチェコチームは2位でした。そして、機械学習の活用に最も積極的だった決勝進出チーム、ヘリオット・ワット大学は3位でした。しかし、結果が曖昧に思えるとしても、ハイブリッドシステムの勝利はラム氏をはじめとするAI専門家にとって完全に理にかなっています。「私たちは、この2つのアプローチをどのように組み合わせるのが最適か、まだ模索し始めたばかりです」とラム氏は言います。
コンテスト参加者全員が、機械学習の発展に最も役立つものは何かという点でも意見が一致しています。それは、より多くの会話データです。これは、最終的にはAmazon自身のコンテストの戦利品です。コンテストを通じて、ユーザーはソーシャルボットと何百万回もやり取りし、10万時間以上のチャットを記録しました。それらはすべて、現在Amazonの公式の財産となっています。大騒ぎや巨額の小切手はさておき、このコンテストのもう一つの大きな勝者は明らかです。それはAmazonです。
Amazonの内側
- ディープラーニングがAlexa、Amazon Web Services、そして同社のほぼすべての部門に浸透した経緯
- Alexaが世界を制覇するラボ
- Alexaは広告に話しかけることを望んでいます
James Vlahos (@jamesvlahos ) は、第 25.08 号で、チャットボット形式で父親を追悼した経験について書いています。
この記事は3月号に掲載されています。 今すぐ購読をお願いします。
この記事とその他のWIREDの特集は、 Audmアプリで聞けます。