Googleが音声アシスタントの2つの厄介な不具合を修正

Googleが音声アシスタントの2つの厄介な不具合を修正

私は料理が得意ではないのですが、Nest MiniのGoogleアシスタントにキッチンのタイマーをスタートするように頼んだことが数回ありましたが、うまくいかないことばかりでした。タイマーが消えてしまい、Googleが残り時間を教えてくれないことが多すぎました。また、アシスタントが状況の理解に苦労し、正しく設定するのに何度も試行錯誤しなければならないこともありました。

これらの問題(そして他のいくつかの問題)は、まもなく解決されます。本日から展開が開始されるGoogleの音声アシスタントの最新アップデートでは、アラームやタイマーの設定といったタスクをアシスタントに指示する際の文脈理解力が大幅に向上します。このアップデートには、通話やテキストメッセージの管理に音声コマンドを使用する人にとって嬉しい修正も含まれています。ついに、アシスタントに友人や家族の名前の正しい発音を教えることができるようになりました。 

文脈が重要

ビデオ: Google

音声アシスタントと会話したことがあるなら、おそらく途中でコマンドの内容を変えたことがあるでしょう。「OK Google、タイマーを20分、いや、10分に設定して」と。これまでは、アシスタントは10分のタイマーを「20、いや、10分」と呼んでいたでしょう。しかし、最新のアップデートでは、アシスタントはあなたが間違いを犯したことを理解して、単に10分だけタイマーを設定したいだけなのだと認識します。 

Googleアシスタントでは以前から複数のタイマーを同時に操作できましたが、そのうちの1つをキャンセルしたい場合、何度も何度も操作する必要がありました。アシスタントは、キャンセルしたいタイマーの識別速度が大幅に向上しました。また、各タイマーに「卵を茹でる」などの名前を付けて「エッグタイマーをキャンセルして」と話しかけても、名前が一致しないため、以前のアシスタントでは何を言っているのか理解できませんでした。今回のアップデートでは、この点が修正されています。

アラームに関しては、Googleアシスタントに「既にスケジュールされているアラームを1時間後に設定してください」と指示すると、Googleアシスタントがそれを誤解し、指示した時刻から1時間後にアラームを設定してしまうことがありました。現在は、スケジュールされているアラームを参照していることを理解しており、適切に調整されます。

更新されたタイマーとアラーム機能は、現在、スクリーンレス アシスタント デバイス (Nest スピーカーなど) で利用可能で、後日、スマートフォンやスマート ディスプレイでも利用できるようになる予定です。

これらの改善は、アシスタントが自然言語理解のために使用するシステムを根本から再設計したことによるものです。GoogleアシスタントのNLUおよび会話型AIチームを率いるGoogleの著名なエンジニア、アマルナグ・スブラマニヤ氏は、この再設計により、人間と非人間的なヘルパーとの間で、より自然な会話が可能になると述べています。

「今日、人々がデジタルアシスタントに話しかけるとき、考えるべきことは2つあります。何を実現したいか、そしてそれを実現するためにどのように指示を出すべきか、です」とスブラマニヤ氏は言います。「これは非常に不自然だと思います。デジタルアシスタントに話しかける際には、大きな認知的負担がかかります。自然な会話は、その認知的負担を軽減する方法の一つです。」 

アシスタントとの会話をより自然にするには、リファレンス解決、つまりフレーズを特定の対象に結び付ける能力を向上させる必要があります。例えば、「タイマーを10分に設定して」と言ってから「12分に変更して」と言った場合、音声アシスタントは「それ」という言葉が何を指し示しているのかを理解し、解決する必要があります。

新しいNLUモデルは、機械学習技術、具体的には双方向エンコーダー表現(BERT)を基盤としています。Googleはこの技術を2018年に発表し、Google検索に初めて適用しました。初期の言語理解技術では、文中の各単語を個別に分解していましたが、BERTはフレーズ内の全単語間の関係性を処理することで、文脈認識能力を大幅に向上させています。 

BERTが検索をどのように改善したかを示す例として、ここで言及されているように、「縁石のない丘に駐車」と検索した場合が挙げられます。以前は、結果には縁石のある丘も含まれていました。BERTが有効になると、Google検索で、ドライバーに車輪を路肩に向けるようアドバイスするウェブサイトが表示されるようになりました。しかし、BERTにも問題がないわけではありません。Googleの研究者による調査では、このモデルが障害に関するフレーズを否定的な言葉と関連付けていることが示されており、同社に対し自然言語処理プロジェクトへの取り組みをより慎重に行うよう求める声が上がっています。

記事画像

超スマートなアルゴリズムがすべての仕事をこなせるわけではありませんが、これまで以上に速く学習し、医療診断から広告の提供まであらゆることを行っています。

しかし、BERTモデルがタイマーやアラームに採用されたことで、スブラマニヤ氏によると、アシスタントは前述の調整のような関連クエリにほぼ100%の精度で応答できるようになったという。しかし、この優れたコンテキスト理解機能は、まだすべての環境で使えるわけではない。Googleは、リマインダーやスマートホームデバイスの制御など、より多くのタスクにアップデートされたモデルを徐々に導入していくと述べている。

カリフォルニア大学サンタバーバラ校の自然言語処理グループのディレクター、ウィリアム・ワン氏は、BERTモデルを音声言語理解に適用することは「それほど簡単なことではない」ため、Googleの改善は根本的だと述べている。

「2018年以降、GoogleがこのBERTモデルを導入したことで、自然言語処理の分野全体が一変しました」とワン氏は語る。「BERTは、ある文から次の文へと自然に続く部分や、文と文の関係性を実際に理解します。単語、フレーズ、そして文の文脈的表現を学習するため、2018年以前の先行研究と比べて、はるかに強力になっています。」

これらの改善点のほとんどはタイマーやアラーム機能に限定されるかもしれませんが、音声アシスタントの文脈理解能力は全体的に向上しています。例えば、ニューヨークの天気を尋ねた後、「一番高い建物は何ですか?」や「誰が建てたのですか?」といった質問を続けて尋ねても、アシスタントはどの都市を指しているかを認識した上で、引き続き回答を提供します。これは特に新しい機能ではありませんが、今回のアップデートにより、アシスタントはこうした文脈的なパズルを解く能力がさらに向上しています。

ティーチングアシスタントの名前

ビデオ: Google

アシスタントは、ユニークな名前の理解も向上しました。珍しい名前の人に電話をかけたり、テキストメッセージを送ったりしようとしたことがある方は、Googleアシスタントが正しい発音を認識できなかったために、何度も試さなければならなかったり、全く機能しなかったりしたことがあるかもしれません。 

ありがたいことに、Googleの新しい音声モデリング技術により、アシスタントに名前を読み上げてもらうことで、より正確に認識できるようになりました。スマートフォンのアシスタント設定で手動で設定するだけで使えます。さらに、録音した音声はクラウドにアップロードされず、Googleにも送信されません。「音声を保存しなくても、発音の様々な側面を学習できるのです」とスブラマニヤ氏は言います。 

この改良された名前認識機能は、Androidスマートフォン、スマートスピーカー、スマートディスプレイにおいて、現時点では英語のみで利用可能です。Googleは、近いうちに他の言語にも拡大したいとしています。 

スブラマニヤ氏によると、Googleが音声アシスタントとの会話をより自然なものにしようと試みているのは、長年にわたるGoogle検索の段階的なアップデートと似ているという。「Google検索のごく初期の頃は、検索クエリについて細かく考えなければなりませんでした。今では『近くのコーヒーショップ』と言うだけで済みます。使う言葉の組み合わせについて、それほど深く考える必要はありません。デジタルアシスタントにも同様の進化が見られます。」

しかし、AIと長時間のやり取りを期待するのはまだ無理です。ワン氏によると、機械は特定の種類のリクエストを処理するのにまだ苦労しているそうです。例えば、画像や動画、その他の情報源から学習した回答を提供するのはまだあまり得意ではありません。

「機械が人間と会話し、本当に自然に理解し、自然に反応できるようになるまでには、まだ長い道のりがあります」と彼は言う。


WIREDのその他の素晴らしい記事

  • 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
  • マクドナルドのアイスクリームマシンのハッキングをめぐる冷戦
  • タコの夢が睡眠の進化について教えてくれること
  • 怠け者のゲーマーのためのケーブル管理ガイド
  • パスワードなしでデバイスにログインする方法
  • 助けて!同僚と情報をシェアしすぎていませんか?
  • 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
  • 🎮 WIRED Games: 最新のヒントやレビューなどを入手
  • 🏃🏽‍♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください