世界中で7,000万人以上の聴覚障害者が手話を使用していますが、通訳者の不足は深刻です。Silence Speaksは、テキストを手話に翻訳できるAI搭載の手話アバターでこのギャップを埋めようとしている英国のスタートアップ企業です。
聴覚障害者にとって、コミュニケーションの問題は壊滅的な打撃となり、孤立感を抱かせる可能性があります。特に、背景雑音や混線のある環境ではなおさらです。駅、病院、学校の教室、混雑したオフィスなどでは、聴覚障害者や難聴者にとって会話を聞き取ることはしばしば不可能です。人工内耳を装着している人でさえ、一文から数語しか聞き取れず、声のトーンにも苦労することがあります。
聴覚障害者コミュニティによって開発され、聴覚障害者のために開発されたSilence Speaksは、テキストを英国手話(BSL)に正確に翻訳できます。英国には15万人以上のBSLユーザーがいます。このモデルは、方言、文脈言語、感情的なトーンを網羅したデータセットで学習され、AI生成アバターは単なる直接翻訳にとどまらず、意図や感情を伝えることができます。
WIREDは掲載前に記事を企業と共有しないというポリシーを持っていますが、この記事の編集版をSilence Speaksに送り、同社がサンプル動画用に私をベースにしたAIアバターを生成できるようにしました。テキストに変更はありません。
アクセシビリティの障壁
ボーダフォンでチャットボット向けAIアーキテクチャのパイオニアとして活躍した経歴を持つSilence SpeaksのCEO、パヴァン・マドゥル氏は、3年ほど前に同社を設立しました。彼は、聴覚障害を持つエンジニアの友人と過ごした時間をきっかけに、このアイデアを思いつきました。二人で旅行した際、マドゥル氏は手話サポートの不足が友人の生活にどれほど困難をもたらしているかを目の当たりにし、この問題に取り組むことを決意しました。
彼は、AIの成長する可能性を活かす翻訳技術の開発に着手するため、聴覚障害のある手話ユーザーである3人のフルスタックエンジニアを雇用した。プロジェクト開始当初、チームは手話をテキストに変換し、あらゆる手話を他の手話にリアルタイムで翻訳できるようにしようと試みた。しかし、これは予想以上に困難であることが判明した。
アメリカではアメリカ手話(ASL)が広く使用されていますが、BSLは全く異なり、世界には200以上の手話があります。Silence SpeaksはBSLからスタートしましたが、すぐに地域的なスラングやアクセントが手話にも影響し、手話の速度に影響を与えることに気づきました。試験運用中、エディンバラの手話通訳者は、サウサンプトンやバーミンガムの手話通訳者よりも50%速いことがわかりました。
再考の結果、マドゥル氏と彼のチームは問題へのアプローチを転換し、テキストをBSL(英国手話)とASL(オーストラリア手話)に翻訳できる技術を開発しました。現在のバージョンはクラウド上で動作し、テキスト入力から手話を生成するのに時間がかかりますが、同社はリアルタイムのデバイス内翻訳の実現に向けて取り組んでいます。マドゥル氏によると、これはまだ少なくとも1年はかかるとのことです。その理由の一つは、チームが精度に高い基準を設けていることです。しかし、リアルタイムの手話翻訳は、聴覚障害者にとってポケットサイズの通訳機のようなものになるかもしれません。

写真:沈黙が語る
音声、テキスト、そして手話をあらゆる方向に翻訳できる将来バージョンは、実に魅力的な展望です。現時点では、強固な基盤を構築し、この技術が実際に機能することを実証し、聴覚障害者のアクセシビリティを迅速に向上させる上で役立つことを示すことに注力しています。このプラットフォームには、手話を話さない、あるいはまだ手話を学習中の聴覚障害者向けに、字幕表示機能が組み込まれています。
輸送試験
Silence Speaksは、英国首都ロンドンの250以上の駅と全地下鉄路線を管理するロンドン交通局(Transport for London)との協力を大きく後押ししています。同社は、聴覚障害者や難聴者にとって電車をより利用しやすくするために、Silence SpeaksのAI搭載手話アバターを導入する予定です。車内アナウンスに視覚的な表示機能を追加することで、乗客はよりスムーズに電車を利用できるようになります。また、スマートフォンのQRコードをスキャンすれば、最新情報を収録した手話動画を見ることもできます。
グリーティングカード会社も、誕生日カードなどのイベントカードの作成にSilence Speaksの技術を採用しています。各カードにはQRコードが付いており、受け取った人はそれをスキャンすることで、スマートフォンで特別なサイン入りビデオメッセージをストリーミングできます。
この技術の素晴らしい点の一つは、ライセンシーが独自のキャラクターを作成して手話AIアバターとして使用できることです。キャラクターはフォトリアリスティックにも、漫画風にもできます。この記事では、動画用のアバターを作成するために、写真を1枚提出しました。AIは手話に苦労することが多いのですが、私の指は正確な手話には完璧に見えます。しかし、顔は実に奇妙です(普段より奇妙です)。子供たちは気味が悪いと感じていますが、それほど違和感はなく、企業は選んだキャラクターの改良にさらに時間をかけるでしょう。スパイダーマンやワンダーウーマンのような人気キャラクターを手話通訳者として起用する余地さえあります。
搭乗
Silence Speaksは、新たな投資ラウンドに向けて勢いを増している。英国手話を英国法で認めるための2022年法案を主導した元科学・イノベーション・技術大臣のクロエ・スミス氏が、同社の取締役会長に就任した。
「手話を使う人はしばしば排除されがちですが、それは間違っています」と彼女はWIREDに語った。「私たちのアプリが、聴覚障害者コミュニティと健聴者コミュニティのより良いコミュニケーションに役立つことを願っています。」
主な用途の一つは、職場における聴覚障害者や難聴者への対応です。職場ではアクセシビリティが課題となる場合があります。英国王立聴覚障害者協会(NRD)の報告によると、聴覚障害のある専門家の85%が職場での排除を経験しています。スミス氏は、英国における人事・人材開発の主要専門団体である英国公認人事開発協会(Chartered Institute of Personnel and Development)の会長も務めています。彼女は、Silence Speaksのようなテクノロジーが、障壁を打ち破り、インクルージョンの領域を広げる上で大きな役割を果たすと示唆しています。
教育もまた、アクセシビリティの向上が急務となっている分野です。英国の教育制度には約5万人の聴覚障害児がおり、その大半はリソースが限られている一般学校に通っています。適切な支援がなければ、これらの子どもたちは取り残される危険性がありますが、手話通訳を提供する学校は少なく、提供している学校でも時間の一部しか提供していないことがよくあります。この技術は、手話通訳の子どもたちにとって教室環境を大幅に改善する可能性があります。
Silence Speaksは、聴覚障害者や難聴者をターゲットとした唯一の新技術ではありません。スマートグラスの普及に伴い、XRAIのような企業が聴覚障害者や難聴者のために生活に字幕を付けようと試みています。また、Nuanceは、音声を増幅し補聴器としても機能するマイクとスピーカーを内蔵したオーディオグラスを提供しています。Googleは2024年に、他の人と話しているときにグラスにリアルタイムで字幕が表示される拡張現実グラスを発表しました。さらに、Appleの人気モデルAirPods Pro 2も2024年に無料アップデートされ、特定の周波数を増幅する補聴器機能が追加されました。人によって好みのアプローチは異なり、これらの技術が共存できない理由はありません。
Silence Speaksが技術開発を進める上で、信頼性が鍵となります。これは、私が同社と話をするたびに誰もが口にする言葉です。聴覚障がいを持つエンジニア、聴覚障がい者コミュニティ、そして言語学者を設計に積極的に参加させることは、同社にとって中心的な役割です。同社は、ユーザーにとって本物らしく感じられる直感的なシステムを提供することを目指していますが、この種の技術では必ずしもそうとは限りません。