2014年にAmazonがスマートスピーカーEchoを発売した際、人々は音声操作の利便性に驚嘆しました。しかし、その目新しさは薄れ、今ではAlexaの誤認識の多さに不満を抱く人が増えています。
現在、Amazon は、ユーザーを教師として Alexa をさらに賢くする計画を立てています。
一部のコマンドでは、Alexaは混乱した場合、すぐに説明を求めます。例えば、ライトを「読書モード」に設定してほしいと頼むと、デバイスは丁寧にその意味を尋ねます。例えば、ライトの明るさを40%に設定してほしいと指定すると、Alexaはこの設定を「学習」し、将来の参照用に保存します。Amazonによると、この機能は「今後数ヶ月以内」に利用可能になる予定です。
大したことではないように思えるかもしれないが、いつ説明を求めるべきかを判断するには相当の人工知能が必要であり、機械が即座に人間から学習できるようにするための一歩となる。
「明確化能力は、優れた会話型人工エージェントにとって基本的な特性となるでしょう」と、MITでAIと言語学を専門とするロジャー・レヴィ教授は述べています。彼は、いつ質問すべきか、そして何を質問すべきかを知ることが、より高度なAIシステムにとって不可欠になると述べています。
しかし、レヴィ氏は、これを自然に感じさせることは難しいバランスを取る行為だと指摘し、「説明を求めすぎると、ユーザーを怒らせてしまいます。」

現時点では、Alexaはサーモスタットや照明といったスマートホームデバイスに関連したコマンドの明確化のみを目指しています。しかし、木曜日のライブストリーミングイベントでAlexaの機能強化を発表したAlexa人工知能チームの主任科学者、ロヒット・プラサド氏は、Alexaはこの種の学習をあらゆるAlexaタスクに拡張したいと考えていると述べています。
Alexaに、馴染みのないコマンドでも、より詳しい情報があれば実行できる可能性があることを理解させ、何を尋ねるべきかを判断し、それを実行するには、複数の言語アルゴリズムを連鎖的に通して発話を送信する必要があります。あるアルゴリズムは、質問が不明瞭だが回答は可能かもしれないと判断し、別のアルゴリズムは、明確化が必要な概念を抽出し、3つ目のアルゴリズムは、曖昧なコマンドに対して実行可能なアクションを導き出します。
単純なコマンドであれば簡単に理解できるかもしれませんが、複雑なコマンドの場合は複雑になることがあります。例えば、Alexaにお気に入りの曲を再生するように指示するには、曲が変わったときにそれを理解する能力が必要になります。
Amazon、Google、Appleが音声コンピューティングの覇権を争う中、AmazonはAlexaを目もくらむような様々なガジェットに搭載しています。同時に、これらのデバイスのセキュリティや、テクノロジー企業がユーザーの音声を収集・分析することによるプライバシーへの影響に対する懸念も高まっています。警察からの音声データ提供の要請は増加しています。
Amazonによると、この機能はデフォルトで有効になるという。広報担当者によると、ユーザーはAlexaの質問に答えないことを選択することで事実上オプトアウトでき、その方法で収集された情報はすべて削除できるという。
プラサド氏が木曜日に発表したその他の新機能には、より自然なイントネーションの音声が含まれます。また、Alexaチームは、カメラを搭載したAlexaデバイスにおいて、ユーザーの言語や声のトーン、そして視覚的なヒントに基づいて、Alexaが適切と判断した場合、会話に割り込んだり、会話に割り込んだりする機能の開発にも取り組んでいるとプラサド氏は述べています。この機能は2021年に導入される予定で、ユーザーはAlexaに「会話に参加して」と話しかけることで、この機能を利用することができます。

超スマートなアルゴリズムがすべての仕事をこなせるわけではありませんが、これまで以上に速く学習し、医療診断から広告の提供まであらゆることを行っています。
Alexaにリアルタイム学習をさせることは、人工知能における重要な課題解決に向けた小さな一歩です。最も賢いアルゴリズムでさえ、一般的には固定された大量のデータで訓練されるため、人間とは異なり、曖昧さを解消したり新しい情報を組み込んだりすることはできません。現在、Alexaがあなたの言っていることを理解できない場合、ロボットのように肩をすくめるような反応を示すでしょう。「申し訳ありませんが、理解できません」または「もしかして…?」
OpenAIのGPT-3のような強力な新しいAIアルゴリズムは、驚くほど人間に近い方法で言語を処理できます。しかし、元の学習データに何かが欠けていると、これらのアルゴリズムは行き詰まってしまうと、故マイクロソフト共同創業者のポール・アレン氏が設立した非営利研究機関、アレンAI研究所(Ai2)のCEO、オーレン・エツィオーニ氏は指摘します。「時には、明確な質問が千の言葉に値するのです」とエツィオーニ氏は言います。
AI専門家の中には、機械と会話することこそが、機械をより賢くする唯一の方法だと考える者もいる。IBMのクイズ番組「Jeopardy!」をプレイするコンピューターWatsonの開発を主導したAI研究者、デビッド・フェルッチ氏は、Alexaに明確に定義されたタスクについて簡単な質問をさせれば、うまく機能するはずだと考えている。しかし、現在、人間と会話することで学習するAIシステムの開発に取り組んでいるフェルッチ氏は、言語の複雑さと曖昧さが、すぐに物事を困難にしてしまう可能性があると警告している。例えば、Alexaにベースラインが素晴らしいヒット曲を再生するように頼むには、ポピュラー音楽について複雑な議論が必要になるかもしれない。
そして、音声アシスタントが間違った質問をしたら、これまで以上に迷惑なものになるでしょう。「下手したら、誰もあなたに頼ってくれません」と彼は言います。
更新日:2020年9月24日午後4時20分(東部標準時):この記事の以前のバージョンでは、ユーザーが新機能の利用を停止できると誤って記載されていました。
WIREDのその他の素晴らしい記事
- 📩 テクノロジー、科学、その他の最新情報を知りたいですか?ニュースレターにご登録ください!
- ポーカー界を揺るがした不正スキャンダル
- ラブバグウイルスの背後にいる男の20年間の追跡
- ビデオゲームスターのマネジメント業界の内幕
- Bluetoothヘッドホンの最も厄介な問題を解決するヒント
- 木は近くの腐敗した死体を見つけるのに役立つでしょうか?
- 🎧 音に違和感を感じたら、ワイヤレスヘッドホン、サウンドバー、Bluetoothスピーカーのおすすめをチェック!