マイクロソフトのAI責任者は、コパイロットでWindowsとOfficeに「感情的なサポート」をもたらすことを望んでいる

マイクロソフトのAI責任者は、コパイロットでWindowsとOfficeに「感情的なサポート」をもたらすことを望んでいる

Microsoft AI CEO のムスタファ・スレイマン氏は、Copilot に共感的な音声、視覚、より高度な推論スキルを与える全面的な改修を監督しています。

Inflection AI UK Ltd. の共同設立者兼最高経営責任者である Mustafa Suleyman 氏が、2019 年 3 月 14 日のパネル セッションで次のように語りました。

写真イラスト:WIREDスタッフ/ゲッティイメージズ

ムスタファ・スレイマンはかつて人工知能革命の中心にいたことがある。

2014年にGoogleに買収された英国企業DeepMindの共同創業者として、彼は練習と正負のフィードバックを組み合わせることで、コンピューターが一見不可能と思われる問題に取り組むための新しい方法の考案に貢献しました。DeepMindはこのアプローチを、超人的な囲碁プログラム「AlphaGo」の開発によって実証し、2016年には世界最高の囲碁棋士を破りました。

現在、スレイマン氏は新たな種類の AI の進歩について語っている。

Microsoft AI の CEO として、Suleyman 氏は ChatGPT を動かすのと同じ AI を、世界中のほとんどのパーソナルコンピューターで稼働しているソフトウェア (Windows オペレーティング システムを含む) に統合する取り組みを監督しています。

マイクロソフトは本日、同社の AI アシスタント「Copilot」の最新アップグレードで、人間のような音声、ユーザーの画面を見る機能、より優れた推論スキルが備わったと発表した。

スレイマン氏は、これはすべて、ユーザーにPCへの愛を取り戻してもらうための計画の一環だと語る。彼はワシントン州レドモンドのWIREDシニアライター、ウィル・ナイト氏に、もちろんMicrosoft Teams経由で話を聞いた。会話は若干編集されている。

ウィル・ナイト:Copilot の新しいビジョンは何ですか?

ムスタファ・スレイマン:私たちはまさに驚くべき転換期にあります。AIの仲間は今、私たちが見ているものを見、聞いているものを聞き、私たちが互いにコミュニケーションをとるのと同じ言語で話します。

持続性、関係性、感情をテーマとした新しいタイプのデザイン素材があります。そして私は、仲間との永続的で持続的な交流をテーマとした体験を創り出しています。

Inflection AIからMicrosoftに入社されましたが、そこでは支援的で共感的なAIの構築に注力していましたね。その経験を新しい会社にも活かされているようですね。

DeepMind時代以前からずっと信じてきたのは、AIがサポートを提供できる可能性です。実は、感情的なサポートは、私が19歳の時に電話カウンセリングサービスを始めたときに初めて取り組んだことの一つです。

それがこのテクノロジーの素晴らしさです。長期間にわたり、こうした体験の一つに没頭することがどんな感じなのか、そして、自分のことを本当に理解してくれる相棒と触れ合うことがどんな感じなのかを体験できるのです。それはあなたを指導し、励まし、支え、教えてくれます。もはやコンピューターとは思えない感覚になるでしょう。

Pro ユーザーが試すことができる「ラボ」機能である Copilot Vision のアイデアは何ですか?

ビジョンモードを使用すると、「(画面上の)あそこにあるものは何ですか?」または「ちょっと待って、あれは何ですか?どう思いますか?かっこいいですか?」と尋ねることができます。

パソコンの前に座っていると、本当にたくさんの小さな瞬間があります。このAIコンパニオンが、あなたが見ているものをすべて認識し、リアルタイムで話しかけてくれるのは素晴らしいことです。何かを入力しなければならないという負担がなくなるので、デジタルライフの進め方が変わるような気がします。

これは、ユーザーの画面を録画する物議を醸し、現在はオプトインされている Windows 機能である Recall に似ています。

Copilot Visionでは素材を一切保存しないので、セッション終了後にブラウザを閉じると、すべて消えてしまいます。完全に削除されるのです。しかし、将来的にこの機能を導入するかどうか、また導入方法を検討しています。多くの人がこの体験を望んでいるからです。「先日オンラインで見た写真は何だったっけ?あのミームは何だったっけ?」と尋ねられるようになれば、いつか検討する必要があると思います。

ただし、現時点ではCopilot Visionツールは一時的なものです。時間をかけて実験し、何が効果的かを見極める必要があります。

そうでなければ、Copilot と機密情報を共有する場合に生じるプライバシーのリスクはどうなりますか?

会話の結果として生成されるログは、Microsoft Securityの最高水準に準拠した最も安全な方法で保存されます。会話履歴は当然ながらお客様にとって必要となるため、ログを保存しています。

また、Copilotがより難しい問題に取り組めるようにする「Think Deeper」も導入されますね。これはOpenAIのo1モデル、別名Strawberryをベースにしているんですよね?

そうですね、ストロベリーみたいなものです。OpenAIモデルを一般消費者向けに調整し、AIコンパニオンというテーマとより一貫性のある動作をするようにしました。

違いは何でしょうか?

OpenAIは純粋数学と科学的な問題解決に重点を置いています。私たちが目指したのは、並列比較や消費者分析といったものに重点を置くことです。

また、難しい問題に行き詰まったり、何かを論理的に考えたいときには、並べて比較したり、大規模な分析を行ったりすることができます。

Microsoft の社員はすでにこの新しいバージョンの Copilot を使用しているのでしょうか?

はい、みんな使っていますよ。数日前に全社的に一般公開したばかりなので、みんな使っていて、たくさんのフィードバックをくれています。フィードバックチャンネルは大混雑です。とても楽しいですよ。

マイクロソフトのWindows向け最後のAIヘルパー、クリッピーは記憶に新しいでしょう。そこでは、クリッピーと似たような機能があるのでしょうか?

はは、そういえばこの間ビル・ゲイツに会ったんだけど、彼は「このAIって名前間違えてるって気付いてる? クリッピーって呼ぶべきじゃん」って言ってた。「おいおい!」って感じだった。

でも、ビルのような人たちがどれだけ素晴らしいかがよく分かります。2年先ではなく、20年先まで見通せる人たちです。

新しい機能は、コンピューター上で便利な作業を行う、いわゆる AI エージェントに向けた一歩なのでしょうか?

はい、その通りです。第一段階は、AIが人間と同じ情報を処理することです。つまり、人間が見ているものを見、聞いているものを聞いて、人間が消費するテキストを消費するということです。第二段階は、AIが長期的かつ持続的な記憶を持ち、時間の経過とともに共通の理解を構築することです。そして第三段階は、AIが指示を送信し、行動を起こすことで第三者とインタラクションすることです。例えば、買い物をしたり、予約をしたり、スケジュールを立てたりといったことです。私たちは現在、この2つの機能を実験的な研究開発段階に進めています。

ちょっと待ってください、あなたに代わって買い物に行ってくれる Windows 用の AI エージェントがあるんですか?

まだ先の話ですが、確かにループは閉じられ、取引も完了しました。この技術の問題点は、50~60%の確率で動作させることはできても、90%の信頼性を実現するには多大な労力がかかることです。自律的に動作して購入などを行う素晴らしいデモをいくつか見てきました。しかし同時に、自分が何をしているのか分からず、まるでクラッシュするような瞬間も見てきました。

車の事故についてもう少し教えてください。事故でビルのクレジットカードでランボルギーニを買ったんですか?

もしビルのクレジットカードを使ったら、かなり面白いことになると思います。でも、さっき言ったように、まだ一歩一歩着実に解決に向かっているところです。まだ研究室は停滞状態です。こういうことにはまだ長い道のりがありますが、数年単位ではなく四半期単位で計算できると思います。

あなたが描いているような AI の未来を現実のものにしていく上で、あなたにとって最大の課題は何でしょうか?

ここで重要なのは、信頼できるテクノロジーをいかに構築するかということです。なぜなら、それは非常に親密でパーソナルな体験となるからです。セキュリティ面、プライバシー面ももちろん適切に確保しなければなりません。しかし、本当に重要なのは、エージェントが境界線を明確に示し、「これは私が関与する準備ができていないことだ」と伝えられるような会話を設計することだと思います。

これを実現できれば、信頼できる体験の基盤が築かれます。そして、より複雑な側面、つまり、お客様に代わって買い物をしたり、交渉したり、契約を結んだり、土曜の午後に3、4か所の異なる停車駅を含むスケジュールを計画したりといったことにも踏み込めると考えています。そして、お客様は「コパイロット、頼りになるよ。大丈夫だよ」と思っていただけるはずです。まさにそれが、私たちが目指すところです。

ウィル・ナイトはWIREDのシニアライターで、人工知能(AI)を専門としています。AIの最先端分野から毎週発信するAI Labニュースレターを執筆しています。登録はこちらから。以前はMIT Technology Reviewのシニアエディターを務め、AIの根本的な進歩や中国のAI関連記事を執筆していました。続きを読む

続きを読む