郭新華氏は、コンピューターにエコーロケーションを教えようとしている。彼と同僚たちは、薄型のノートパソコンほどの大きさの装置を開発した。この装置は、ピッコロが出すことのできる最も高い音の10倍も高い周波数の音を発する。この装置が発する音は人間の耳には聞こえない。郭氏のチームがこの装置を人間に向けて超音波を発射すると、装置は内蔵された数百個のマイクでエコーを拾う。そして、人工知能技術を用いて、反射音だけからその人が何をしているのかを解読しようとする。
この技術はまだ初期段階ですが、有望な初期成果が得られています。中国・武漢理工大学を拠点とする郭氏のチームは、4人の大学生を対象にマイクアレイをテストし、その人物が座っているか、立っているか、歩いているか、あるいは転倒しているかを完全な精度で識別できることを発見しました。これは、本日Applied Physics Letters誌に掲載された論文で報告されています。この技術がより多くの人々に有効であること、そしてより幅広い行動を識別できることを検証する必要があるものの、今回のデモンストレーションは、人間の行動を監視するための新たな技術の可能性を示唆しています。
郭氏のデバイスは、人間活動認識と呼ばれる技術分野に属し、コンピューターが信号を分析して人が何をしているかを把握する。たとえば、スマートウォッチの歩数計は、加速度と回転のデータを装着者の歩数に変換する。現在、郭氏のような研究者は、より洗練されたAI技術の助けを借りて、より複雑な人間の行動を識別できるシステムを設計している。郭氏のように音声データを扱う研究者もいれば、より優れた画像認識アルゴリズムを開発している研究者もいる。ミュンヘンのルートヴィヒ・マクシミリアン大学のコンピューター科学者、アルブレヒト・シュミット氏によると、一部の研究者は周囲のWi-Fi信号を分析することで、単純な人間のポーズを識別できることさえ示しているという。「人間が信号の中を移動すると、信号が変化します」と同氏は言う。Wi-Fi信号の変動から、たとえば、人が拍手しているのか、電話をかけているのか、しゃがんでいるのかなどがわかる。

郭新華
郭氏のチームは、音信号と特定の人間の姿勢を関連付けるアルゴリズムを設計しました。デバイスがエコーを捉えた後、アルゴリズムはまず周囲のノイズを除去し、次にデータのパターンを分析します。例えば、反射音の周波数の混合は、部屋の中で何が起こっているかについてのヒントとなります。人がどのような姿勢をとっているかによって、ある音程の音が他の音程よりも多く反射されます。アルゴリズムはこれらの違いを利用して、人の姿勢を判定します。
郭氏によると、エコーを拾うマイクの数を増やすほど、アルゴリズムの精度は向上する。様々なポーズにおける音色の違いがより鮮明に見えるという。郭氏が現在開発中の256個のマイクを使ったアレイは大型で、大量生産するにはコストが高すぎる可能性が高いため、精度を損なうことなくマイクの数を減らす取り組みを進めている。
しかし、企業はまだこれらの新しい行動検知技術を商用製品として開発していない。シュミット氏は、「これらの技術が実際に何に使われるのか、そもそも使われるのかどうかさえもまだ不明だ」と述べている。
郭氏は、このサウンドアレイについていくつかのアイデアを持っている。一つの可能性は、将来的にAmazon Echoのようなデバイスに組み込むことで、自宅で高齢者が転倒する音を検知できるようにすることだ。また、画像認識ソフトウェアや動画認識ソフトウェアの代替として活用できる可能性もあると彼は考えている。音は、暗い部屋や煙の多い場所など、カメラでは認識できない環境でも物体を識別できると彼は言う。
郭氏はまた、音声による監視はビデオ監視よりも個人のプライバシーをよりよく保護できるため、人々が自宅でこの技術をより受け入れやすくなる可能性があると考えている、と同氏は言う。
しかし、ニューヨークに拠点を置く研究機関、データ・アンド・ソサエティの技術倫理学者ジェイク・メトカーフ氏は、音声監視をビデオと組み合わせることで、監視体制を強化することも容易だと主張する。
研究者は特定の用途を想定して技術を開発するかもしれませんが、人々が最終的にどのように使用するかは制御できないからです。音声監視は、高齢の親の命を救うことになるかもしれませんが、同時に、ひざまずいて祈るイスラム教徒を国家が見つけ出し、迫害するために悪用される可能性もあると、メトカーフ氏は指摘します。これは、中国がウイグル族少数民族の監視を続けている現状に言及したものです。ハッカーがこれを改造して、性行為中の人物を盗聴することも可能かもしれません。「こうした技術は、再利用を強く求めています」と彼は言います。「それが技術の本質であり、だからこそ価値があるのです。」
しかし、郭氏の技術はまだ完成には至っていない。何らかの製品に搭載する前に、彼のチームはデバイスをさらに開発する必要がある。ハードウェアを小型化する必要があり、アルゴリズムがより多くの人々やより多様なシナリオで機能することを確認するために、さらなるテストを行う予定だ。例えば、より多様な人口統計を持つ人々の行動データを収集し、様々な角度で落下させる、と郭氏は語る。サウンドアレイがより賢くなれば、誰かがそれをどのように活用するかを解明するかもしれない。
WIREDのその他の素晴らしい記事
- 月塵が私たちの月探査計画を曇らせるかもしれない
- ソーシャルVRが成長するにつれ、ユーザーがその世界を構築するようになる
- Bluetoothの複雑さはセキュリティリスクとなっている
- Squareの怪しい自動メールに激怒している
- 中国の大規模監視活動の内幕
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください。
- 📩 毎週配信されるBackchannelニュースレターで、さらに多くの内部情報を入手しましょう