次世代のAIウェアラブルは、あらゆる音を常に聞き取る

次世代のAIウェアラブルは、あらゆる音を常に聞き取る

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

CESで一日中、小さな黄色いブレスレットを着けていました。近くにいる何も知らない人から見れば、フィットネストラッカーにしか見えなかったかもしれません。しかし、その間ずっと、Bee AIのこの黄色いPioneerウェアラブルは私の周りのあらゆるものを記録していました。一般的なレコーダーアプリのように音声を保存するわけではありませんでしたが、会話を処理し、パーソナライズされたToDoリストと、対面での会話の読みやすい要約を提供してくれました。

展示会の数日前、私は今日初めて公式発表された新興企業、Omiの創業者と話をしました。一体何をするのでしょうか?周囲のあらゆるものを記録して活動ログを作成し、AIがその情報を配信することで、その日の行動につながるインサイトやタスクをユーザーに提供してくれるのです。まるでパーソナルアシスタントのようです。Omiのウェアラブルは首にかけることもできますが、額のこめかみ付近に貼り付けるのがベストです。内蔵の脳波計で、Omiによると、ウェアラブルに話しかけようと具体的に意識すると、デバイスがそれを理解し、ユーザーのリクエストに応えてくれるそうです。

これが私たちが生きている新しい世界です。人工知能を搭載したウェアラブルデバイスが、私たちの周囲の世界を絶えず記録しています。音声アシスタントは、最初はスピーカーやスマートフォンに搭載されていましたが、すぐに手首や顔に搭載されるようになりました。盗聴機能を起動するには、少なくともタップやウェイクワードといった能動的な操作が必要でした。しかし、近々発売されるフレンドペンダントも含まれる次世代のハードウェアアシスタントは、情報を受動的に吸収し、バックグラウンドで動作します。常に聞き耳を立てているのです。

この分野をリードするウェアラブル ハードウェアは安価なものが多い (Bee AI の時計はわずか 50 ドル、Omi の貼り付け型ビーズは 89 ドル) が、本当の魅力はソフトウェアにあり、会話を分析するために複数の大規模な言語モデルを利用するため、多くの場合サブスクリプションが必要となる。

ビーAI

画像には電子機器、携帯電話、電話、iPhone、大人、アクセサリー、ブレスレット、ジュエリーが含まれている場合があります

Bee AI の黄色いウェアラブルは、ユーザーのやり取りを聞き取り、モバイル アプリでテキスト トランスクリプトを提供します。

写真:トリスタン・デブラウウェア

Bee AIは、マリア・デ・ルルド・ゾッロ氏とイーサン・スーティン氏によって設立されました。2人は以前、ビデオチャットでメディア画面を共有し、離れた場所にいる人々が同じ映画やYouTube動画を一緒に視聴できるようにするSquad(スーティン氏が創業者)で働いていました。同社は後にX(当時Twitterという社名)に買収され、2人はTwitter Spacesの開発に携わるため、短期間同社に加わりました。ゾッロ氏は以前、テンセントと、後にTikTokの前身となるMusical.lyで働いていました。

スーティン氏によると、チャットボットが大流行していた2016年にパーソナルAIアシスタントのアイデアを模索していたものの、当時はまだ技術的には実現していませんでした。しかし今は違います。同社は昨年2月にBee AIプラットフォームのベータ版をリリースし、活発なコミュニティからフィードバックを得ています。Pioneerハードウェアの販売を開始したのは、つい1週間ちょっと前のことです(「Bee」という名前は、何かが周囲を飛び回りながら情報収集しているというアンビエントコンピューティングの概念を巧みに表現したものです)。Bee AIを使用するのに同社のハードウェアは必要ありません。iPhoneアプリを介してAIとやり取りするだけで済みます。しかしゾッロ氏によると、このウェアラブルデバイスは一日中継続的に記録できるため、より豊かな体験を提供するとのことです。Androidアプリは今月末にリリース予定です。

このウェアラブル端末はシンプルだ。ノイズアイソレーション用のマイクが2つ搭載されており、Sutin氏によると、騒がしい環境でも相手の声が聞こえるのであれば、この端末も両方の声を拾えるはずだという。手首にバンドとして装着することも、シャツにクリップで留めることもできる。中央には「アクション」ボタンがあり、一度押すとマイクがミュートになり、もう一度押すとマイクがオンになる。ボタンは長押しすることもでき、このアクションはユーザーが設定可能で、現在の会話を処理したり、「Buzz」AIアシスタントを起動して質問させたりといった操作をトリガーできる。(このウェアラブル端末にはスピーカーがないため、回答はスマートフォンから音声で伝えられる。)マイクがミュートされているときは赤いLEDが点灯する。録音中は緑のLEDが点灯するはずだが、このウェアラブル端末が周囲の音を拾っていることを示すものは何もない。

ゾッロ氏によると、常に緑色のLEDが点灯していると、ウェアラブルの7日間という謳い文句のバッテリー寿命に影響が出るという。しかし、このLEDの欠落によって、Bee AIは米国各州で異なる録音法のグレーゾーンに陥ってしまう可能性がある。ウェアラブルは技術的には音声を保存していないものの、会話の全文記録を見ることはできる。ただし、完全に正確ではない場合もある。スーティン氏は、記録されたデータはすべて「最大限の機密性を持つものとして扱われる」と述べ、同社のビジネスモデルには収集されたデータを収益化する計画はなく、第三者と共有されることもないと保証した。さらに、このデータは人間が見ることはできないとも述べている。

会話は端末上でローカル処理されるわけではない。Sutin氏によると、エッジ処理との差は縮まりつつあるものの、バッテリー寿命は依然として根本的な問題となっている。そのため、現時点ではデータはクラウドで処理されている。Bee AIがどの大規模言語モデルを導入するかは、実行したいタスクによって異なる。OpenAIのChatGPTやGoogleのGeminiといった商用モデルとオープンソースモデルに加え、同社が自社でホストしているモデルもいくつかある。

サティン氏によると、Bee AIのターゲット層は「仕事柄、よく話す」人々だ。一日中デスクに座って誰とも話さないのであれば、こちらが質問しない限り、Bee AIのウェアラブルが処理することはあまりない。しかし、常に録音しているので、一日を通して交わした会話を思い出すことができる。Beeは必ずしもあなたの周りの人々が誰であるかを知っているわけではないので、その精度には多少のばらつきがあるが、様々な話し声を識別し、会話の書き起こしを整理して、異なる話者を表示することができる。他の話者には名前を付けることができる。また、あなたに関する事実を保存することもできる。同様に、録音したくない内容は、消去するように指示することもできる。

アプリでは、1日を通して行った会話の要約を見ることができます。1日の終わりには、その日の様子をまとめたスニペットが生成され、会話が行われた場所が地図上に表示されます。しかし、最も興味深い機能は真ん中のタブにある「ToDo」です。これは会話に基づいて自動的に生成されます。編集者と話していて、ある商品の写真を撮ることについて話していたところ、なんとBee AIが「マイクのために写真を撮るのを忘れないように」というToDoを作成してくれたのです(会話中にマイクの名前を言ってしまったに違いありません)。完了するとチェックマークが付きます。

これらのToDoリストは、実際にはやらなくてもいいことが多いので、この点は指摘しておく価値があります。おそらくほとんどは削除することになるでしょうが、タスクを正確に取得できた時は、まるで魔法のような感覚です。Bee AIはGmail、Googleカレンダー、Googleコンタクトのアカウントに接続できるので、メールの要約やカレンダーの予定をまとめて表示させることができますが、今回はこの機能を試す機会がありませんでした。

Zollo氏によると、Bee AIはフリーミアムのサービスモデルを採用しており、ハードウェアのみで基本的な記憶想起機能と要約機能が利用できる。同社が今後拡張したいと考えているサードパーティ製アプリとの連携機能など、その他の多くの機能を利用するには、月額12ドルを支払う必要がある。

近江

Omi AI ウェアラブル。

Omi のウェアラブルは頭に貼り付けることができます。

OMI提供

ニキータ・シェフチェンコは14歳で仮想通貨マイニングを始め、起業の道を歩み始めました。18歳で最初の会社を売却した彼の最新プロジェクトは、ペンダントとして身に着けるか、付属の医療用テープを使って額の側面に貼り付けるウェアラブルデバイス「Omi」です。後者を選ぶ場合、見た目がいかに不自然であっても気にしないのであれば、シェフチェンコ氏によると、Omiに話しかけるという具体的な意図があれば、Omiは理解し、リクエストを処理する準備を整えてくれるそうです。

まだ試していませんが、Omiはウェアラブルデバイスに話しかける際に特定の脳波を認識するようにトレーニングされているため、特定の言葉を言う代わりに、ただ考えるだけで済むとのことです。ただし、このインタラクションはデバイスとやり取りしたい時にのみ使用します。それ以外の時は、OmiはBee AIと同様に、一日を通しての会話をキャプチャするウェアラブルマイクです。この機能により、会話の書き起こし、要約、カレンダーへのイベント追加、翻訳など、Bee AIと同じような多くの機能を実行できます。

すべてはペアリングされた電話とクラウドで処理されるため、これもまたHumane Ai Pinのようなスタンドアロンのハードウェアではありません。シェフチェンコ氏によると、Omiはオープンソースですが、現在はChatGPTでトレーニングされています。OmiがBee AIと異なる点の1つは、サードパーティのアイデアのためのマーケットプレイスです。コミュニティによって作成された「アプリ」がありますが、これらはOmiと日常的なアプリの統合を強化するmodまたはスキルのようなものだと考えてください。たとえば、Googleドライブの「アプリ」を有効にすると、1日の終わりにすべての会話の概要がドライブフォルダーに保存されます。これらのアプリはOmiのストアで公開でき、開発者は無料または有料にすることができます。シェフチェンコ氏が昨年Omiの初期バージョン5,000台を開発者に出荷したため、すでに数十のアプリがあります。

彼によると、Omiは将来的に、ユーザーが自身のAIクローンを作成できるようになるという。クローンは自分の代わりにフォロワーと会話したり、質問に答えたりできる。ユーザーはこれらのクローンを無料で、あるいは有料で公開し、副収入を得ることができる。これは既にOmiのPersonasプラットフォームで一部実現されており、誰でもTwitterのキャラクターのAIクローンを作成し、チャットすることができる。

Bee AIウェアラブルとは異なり、Omiのウェアラブルは、周囲の会話をキャプチャして処理していることを暗黙的に知らせるライトが常に点灯しています。バッテリーは3日間持続し、Beeと同様に、会話の内容に基づいて完了すべきタスクを残すこともできます。毎晩、翌日の行動計画を送信します。さらにはメンタリング機能も備えています。就職面接を終えた後、面接のまとめと改善点に関するアドバイスを受け取れることを想像してみてください。

シェフチェンコ氏の長期的な目標は、Omiに「脳を読む」能力を持たせ、ユーザーが何を考えているのかを理解させることだ。脳へのインプラントを必要とするNeuralinkの脳コンピューターインターフェースとは異なり、シェフチェンコ氏は頭部に電極を継続的に追加することでこれを実現したいと考えている。彼はより複雑なウェアラブルデバイスでシステムに2つの単語を認識させることに成功したが、実現にはまだまだ長い道のりが残されている。

Omi は本日 89 ドルで発売され、数週間以内に出荷されます。

ヒューマンポッド

画像にはテキスト、数字、記号、電子機器、携帯電話、電話が含まれる場合があります

写真:トリスタン・デブラウウェア

常時監視 AI 搭載ウェアラブルの有用性に興味があるものの、プライバシーの侵害の可能性を懸念している場合は、すべての新しい AI ウェアラブルが「常時オン」のアプローチを採用しているわけではないことを知っておいてください。

スイスのアクセサリーメーカーRolling Squareのチームから派生したNatura Umanaという会社が、HumanPodsというワイヤレスイヤホンを開発しました。マイクは内蔵されていますが、イヤホンをダブルタップして電源をオンにし、搭載されているAIを起動する必要があります。

OmiやBee AI Pioneerと同様に、HumanPodsは一日中装着できるように設計されていますが、バッテリーは1日しか持ちません。インイヤータイプではありませんが、耳にしっかりとフィットし、CESでの限られた時間でのテストでは快適でした。このシステムは複数の大規模言語モデルを採用していますが、周囲のあらゆる音を聞くのではなく、AIに話しかけることに重点を置いて設計されています。

また、チャットできるAIアバターも複数存在します。Athenaはフィットネスと健康に関するAIペルソナで、フィットネスや健康に関するウェアラブルやアプリをAthenaに接続すれば、今日どんなエクササイズをすべきかといった質問をすることができるようになります。Athenaはユーザーの健康データを確認し、睡眠履歴や心拍数など、利用可能なデータに基づいてワークアウトを提案します。Hectorは私が話を聞いたもう一人のAIペルソナで、「AIセラピスト」を担う人物です。CESのストレスについて彼に話したところ、彼はイベントのストレスを軽減する方法、例えば話をする企業を絞り込む方法などを提案してくれました。(同社の創業者であるCarlo Edoardo Ferraris氏によると、Hectorは資格を持ったセラピストではないという免責事項を掲げているそうです。)

人生において、様々な理由で様々な人に頼るように、フェラーリス氏は、それぞれのニーズに合ったAIペルソナが存在するだろうと述べています。彼は、メンタルヘルスのスタートアップ企業が開発したAIセラピストのように、人々がペルソナを公開できるマーケットプレイスを構築したいと考えています。

イヤホンは今年の第1四半期に発売され、Android対応は同時か第2四半期に予定されています。価格は未定ですが、100ドル前後になる可能性が考えられます。もちろん、サブスクリプションも用意されています。

これらのAIウェアラブル製品はすべて、2024年で最も注目を集めたテクノロジー製品の一つであるHumane Ai Pinの悲惨な発売に続くものです。Omiの創業者シェフチェンコ氏は、AIアシスタントの機能を強化するためのアプリを数十種類リリースしているため、自社はHumaneよりも既に優位な立場にあると考えています。一方、フェラーリス氏は、ワイヤレスイヤホンは操作が分かりやすく、アプリはメッセージングアプリのように設計されているため、Natura Umanaのウェアラブル製品の方が成功すると考えています。これは、人々が既に使い慣れているからです。

このようなウェアラブルデバイスは、大抵の場合、過剰な期待を抱くものの期待外れに終わります。常時リスニング機能を備えたAI搭載デバイスは、実際には開発者の意図したほど役立つとは限らないのです。それでも、ウェアラブル業界の先駆者たちは、手首や頭に装着する常時リスニング機能付きガジェットがより役立つ時代へと私たちを導こうとしています。常時オンのマイクは、すぐにニューノーマルになるかもしれません。このような動きに伴うプライバシーへの懸念は、当然ながら警戒を呼び起こすでしょう。そして、その警戒感が、この着実な進歩を遅らせるほどの大きなものになるかどうかは、まだ分かりません。

You Might Have Missed

Too Good to Goは、食品ロス削減のためのおいしい方法を提供します
人類とネアンデルタール人は、何世紀にもわたって繁殖を続けてきた
「オープンソース」という言葉が生まれて20年が経った
アルゴリズムはマスクをした顔をどの程度正確に認識できるでしょうか?
あなたの屋上庭園は太陽光発電農場になるかもしれません
Ammunition x Gantri Lampコレクションが3Dプリントの利点を明らかに
誰もが医療機器を売ろうとしている ― LinkedInでも
性的暴行に対抗するため、女性たちは電気ショック下着に頼っている
各国は海岸の浸食を防ぐために巨大な「砂モーター」を建設している
フェイスブックの選挙戦は今、保守党とモメンタムの間で繰り広げられている
英国はコロナウイルスによる死者数を過小評価し続けている。その理由は?
ドローン配達、食料品供給、そして今週の自動車ニュース
米国の企業が再利用可能な極超音速ロケット機の試験に成功した
モバイル・ワールド・コングレス2020は中止
古いZIPファイルから30万ドル相当のビットコインを解放する試み
オンラインショッピングが現実世界の都市を変革している