Alexaは天気予報を教えてくれます。Siriはジョークをいくつか知っています。中国では、音声コンピューティング企業のiFlytekが、ユーザーに愛されている同様のスマートアシスタントを開発しました。しかし、同社の技術は政府の盗聴にも役立っています。
アニメーション:ジョン・バージェス
WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。
1937年、ジョージ・オーウェルがスペインでファシストと戦っているときに首を撃たれた年、ジュリアン・チェンは上海で生まれた。音楽教師と化学者の両親にキリスト教宣教師が運営する学校に通わされたチェンは、オーウェルと同様に言語に魅了された。彼は英語、ロシア語、北京語を学び、家庭では上海語を話していた。後にフランス語、ドイツ語、日本語も習得した。1949年、毛沢東が権力を握り、オーウェルが『1984年』を出版した年、中国では言語の学習が危険なものとなった。1950年代後半の粛清で、知識人は告発され、労働収容所に送られ、処刑されることもあった。当時、名門北京大学の学生だったチェンは、北京のガラス工場に追放された。
陳の仕事は、石炭と灰を満載した荷馬車を工場の炉まで運び出すことだった。彼は同僚たちの話を聞くことで、頭の回転を速めていた。夜は労働者寮で、北京方言の言語民族誌のようなものを編纂した。1960年頃にその本を完成させたが、間もなく共産党の官僚に没収された。
毛沢東の死後、中国経済の発展には知識人が必要だと党首たちが気づき、彼の運命は好転した。陳は大学に戻り、1979年、42歳で、テストの成績が認められ、数十年ぶりに海外へ渡る大学院生のグループに選ばれる。彼は米国に移住し、コロンビア大学で物理学の博士号を取得した。当時、米国には中国よりも多くのチャンスがあり、多くの同級生と同様、陳も卒業後は米国に留まり、IBMで物理科学の研究に携わった。IBMは世界初の音声認識ソフトウェアを開発しており、これによって専門家はキーボードに触れることなくたどたどしくもメッセージを口述することができた。1994年、同社はそれを中国語に適応させる人材を探し始めた。それは陳の専門分野ではなかったが、彼は熱心に志願した。
陳氏はすぐに、中国では音声認識ソフトウェアがオフィスワーカーのディクテーションツール以上のものを提供できることに気付いた。自分の母国語である中国語でのコミュニケーションを完全に変革する可能性があると彼は信じていた。コンピューター時代の書き言葉として、中国語は長い間独特の課題を抱えていた。5万字を超えるその文字をQWERTYキーボードで入力する明確な方法がなかったのだ。1980年代に最初のパーソナルコンピューターが中国に登場したとき、プログラマーたちはいくつかの回避策を考え出していた。最も一般的な方法はピンインを使うものだった。ピンインとは、中国の学生が学校で学ぶ北京語のローマ字表記のシステムだ。この方法を使うと、catと書くには「mao」と入力し、ドロップダウンメニューから猫を選ぶことになる。このメニューには「貿易」や「帽子」を意味する文字、そして毛沢東の姓も含まれていた。北京語には同音異義語がたくさんあるため、タイピングは単語を選択する上で非効率的な作業になっていた。
ディクテーションエンジンを開発するため、陳氏は中国語を音素と呼ばれる最小単位に分解した。次に、ニューヨーク在住の中国語話者54名を募集し、人民日報の記事の朗読を録音した。北京にあるIBMの研究所は、さらに300名の話者からのサンプルを追加した。1996年10月、システムのテストを終えた陳氏は、音声技術会議で完成したソフトウェア「ViaVoice」を発表するため、中国へ飛んだ。
派手な壁紙で飾られた満員の部屋で、陳氏はその日の新聞を朗読した。目の前の大きなスクリーンに、少し間を置いて陳氏の言葉が映し出された。読み終えると、周囲を見渡すと、人々が口を大きく開けて陳氏を見つめていた。ある研究者が手を挙げ、試してみたいと申し出た。陳氏がマイクを渡すと、会場からざわめきが広がった。ViaVoiceも彼女の言葉を理解していた。
ViaVoiceは1997年に中国で発売され、箱には「コンピューターが中国語を理解します!両手が自由になれば、思考が生き生きと動き出します」と書かれていました。同年、江沢民国家主席がデモに参加しました。まもなく、IBMのライバル企業を含む中国全土のPCメーカーが、自社製品にこのソフトウェアをプリインストールするようになりました。コンピューターと自由に会話できる時代はまだ遠く、ViaVoiceにも限界はありましたが、このソフトウェアは中国語でのテキスト入力の煩わしさを軽減し、中国の専門職層の間で人気を博しました。「当時、これが唯一の選択肢でした」とチェンは回想します。
しかし、中国に留まった学者の中には、アメリカ企業に勤める研究者が中国語習得への第一歩を踏み出したという事実に心を痛めた者もいた。彼らは、中国は陳の功績に匹敵する成果を挙げる必要があると感じていた。
IBMの勝利に刺激を受けた人々の一人が、合肥にある名門中国科学技術大学の音声認識研究室に所属する26歳の博士課程学生、劉青鋒だった。1999年、まだUSTC在学中の劉は、音声コンピューティング企業iFlytekを設立した。その目標は、IBMなどの外国企業と競争するだけでなく、中国の誇りを取り戻す製品を開発することだったようだ。当初、劉と彼の同僚はUSTCのキャンパスで働いていたが、後に合肥内の別の場所に移った。USTCは文化大革命中に合肥に移転していたため、合肥は二級都市だったが、合肥に留まることで、iFlytekは大学の優秀な人材と近い場所にいられるようになった。
劉氏が当時マイクロソフトアジア研究所の責任者だった李開復氏に事業構想を説明した際、李氏はアメリカの音声認識大手に追いつくのは不可能だと警告した。米国では、IBMとマイクロソフトに加え、ベルサウス、ドラゴン、そして非営利研究機関SRIインターナショナルからスピンオフしたばかりのニュアンス・コミュニケーションズなど、複数の強力な企業が業界をリードしていた。これらの企業は、2000年代初頭のコンピューティングの限界を克服し、ユーザーを苛立たせない音声コンピュータインターフェースの構築に苦戦していたが、中国の競合他社をはるかに上回っていた。
劉はリーの警告に耳を貸さなかった。音声インターフェース技術は競争が激しく、華やかさに欠けるニッチ市場であったとしても、劉の野心はそこに並外れた道徳的緊急性を与えた。「音声は文化の基盤であり、国家の象徴です」と、後に彼はiFlytekの創業当時を振り返りながら語った。「多くの人が、彼ら(つまり外国企業)が私たちを首根っこにつかんでいると考えていました」。チームメンバーの何人かが不動産業への進出による多角化を提案した時、劉は毅然とした態度を貫いた。音声コンピューティングを信じない者は辞めてしまえばいい、と。Nuanceは、法人顧客のコールセンター自動化を支援し、人間の交換手から音声操作の電話メニュー(「支払いをするには、『支払い』と言ってください」)へと切り替える支援で、健全な事業を構築していた。iFlytekは、通信会社Huawei向けに同様の業務を提供することで事業を軌道に乗せた。
iFlytekは2008年に株式を公開し、2010年には主要な消費者向け製品であるアプリ「iFlytek Input」をリリースしました。同年、AppleのiPhoneにSiriが搭載され始めました。SiriはSRI Internationalが開発し、Appleが買収したものでした。しかし、Siriが「パーソナルアシスタント」、つまり質問に答えてくれる会話型デジタルコンシェルジュだったのに対し、iFlytek Inputははるかに特化していました。メール、ウェブ検索、そして中国で仕事とプライベートの両方で圧倒的なシェアを誇るスーパーアプリ「WeChat」など、スマートフォンのあらゆる場所で音声入力を可能にしたのです。
人間の音声とのインタラクションを訓練した他の技術と同様に、Inputも当初は精度が低かった。「最初のバージョンでは、ユーザーエクスペリエンスはあまり良くありませんでした」と、USTCの科学者でアプリの技術開発を監督したジュン・ドゥ氏は語る。しかし、実際のユーザーによるアプリの操作データが蓄積され始めると、Inputの音声テキスト変換精度は劇的に向上した。

あなたに関する情報、あなたが何を購入するか、どこへ行くか、どこを見るかといった情報は、デジタル経済を動かす原動力です。
実のところ、SiriとInputは、成熟した音声インターフェース技術の猛攻の中で、比較的初期に登場したものでした。最初に登場したのはMicrosoftのCortana、次にAmazonのAlexa、そしてGoogle Assistantでした。しかし、iFlytekは2012年に第一世代のバーチャルアシスタント「Yudian」をリリースしましたが、すぐにAIの力の多くを別の課題に注力しました。それは、ユーザーが他の方言や言語を話す人の話を理解するのを支援するリアルタイム翻訳の提供です。Inputの後のバージョンでは、対面での会話を翻訳し、23の中国語方言と4つの外国語で通話のクローズドキャプションを表示できるようになりました。中国の人口規模の大きさと相まって、翻訳への注力は、同社が膨大な量のデータを収集することを可能にしています。
アメリカではAlexaやGoogleアシスタントに特定のリクエストを頼むことが多いが、中国では会話全体を操作するのにInputを使うことが多い。iFlytek Inputのデータプライバシー契約では、ユーザーの同意なしに「国家安全保障と国防安全保障」のために個人情報を収集・使用することを認めている。「欧米ではユーザーのプライバシーに関する問題がある」とドゥ氏は言う。「しかし中国では、ユーザーと何らかの契約を結んでおり、そのデータを利用することができる」。中国では音声データが漏洩する可能性がある。例えば、音声データブローカーのData Tangは、自社のウェブサイトで具体的なデータセットについて説明しており、その中には3歳から5歳児の約10万件の音声サンプルが含まれているものもある。
2017年、MITテクノロジーレビューはiFlytekを世界で最も賢い企業50社に選出し、中国政府は厳選した国家「AIチーム」に同社を悲願の地位を与えた。同年選ばれた他の企業は、プラットフォーム大手の百度、アリババ、テンセントだった。その後まもなく、iFlytekは、主要なAI研究所であるMITのコンピュータ科学および人工知能研究所(CSAIL)と5年間の協力協定を結んだ。同社の翻訳技術は、スペインのサッカークラブRCDエスパニョールに採用されており、同社は2022年の北京冬季オリンピックに自動翻訳を提供する独占契約を結んだ。4月中旬の時点で、iFlytekは深セン証券取引所で108億ドルと評価されており、7億人のエンドユーザーを抱え、中国の音声市場の70%を占めていると主張している。同時期に、Nuanceは53億ドルと評価されていた。中国では、音声コンピューティングにおける同社の他の主な競合相手は、主にアリババや百度などのプラットフォームである。
ジュリアン・チェンが、音声コンピューティングが中国におけるコンピューターとのやり取りに革命をもたらすと直感してから20年、その影響は実に劇的です。2017年の統計によると、WeChatユーザーは毎日約60億件の音声テキストを送信しています。これは、一般的な留守番電話よりも親密で即時性のあるカジュアルな音声メッセージです。WeChatではメッセージの送信時間が1分に制限されているため、人々はしばしば長い文章で送信します。iFlytekは、ビジネス会議の内容を自動で文字起こしするタブレット、瞬時に文字起こしを行うデジタルレコーダー、そして全国の自動車に搭載されている音声アシスタントを製造しています。
iFlytekにとって消費者向け製品は重要だが、利益の約60%は、同社の2019年半期報告書に記載されている「政府補助金関連プロジェクト」から得られている。これには「インテリジェント犯罪捜査支援システム」や上海市政府へのビッグデータ支援などが含まれる。こうしたプロジェクトはデータへのアクセスをもたらす。「裁判記録、コールセンターのデータ、セキュリティ関連のデータなど、あらゆるデータが含まれる可能性がある」と、オックスフォード大学人類の未来研究所で中国におけるAIガバナンスを研究するジェフリー・ディン氏は述べている。iFlytekの創業者兼CEOである劉氏は、中国の公式議会である全国人民代表大会の代表である。「彼は政府と非常に良好な関係を築いている」とドゥ氏は言う。
劉氏は、音声コンピューティングが将来、社会のあらゆる分野に浸透するというビジョンを抱いている。最近、国営オンラインメディアの動画チャンネルのインタビューで、「水や電気と同じくらい当たり前の、どこにでも存在するようになるだろう」と語った。これは中国共産党が掲げる監視国家構想と見事に一致する夢だ。
昨秋のある日、私はiFlytek製の即時翻訳デバイス「Translator」の最新モデルを、アル・チェン氏(仮にアル・チェン氏と呼ぶ)と一緒に試用した。QualcommのSnapdragonチップを搭載したこのデバイスは、世界の主要言語でオフラインでも動作する。チェン氏と妻は中国南部の交通量の多い都市に住んでいるが、隔年に中西部の親戚を訪ねて出かける。運動のため、毎朝ショッピングモールまで半マイル(約800メートル)歩くのだ。しかし、北京語、広東語、客家語で芸術や文化について熱弁をふるうチェン氏は、英語を全く話さない。米国にいる間は、ほとんどの場合、不機嫌そうに沈黙している。まさに彼こそがTranslatorが必要なタイプの人間なのだ。
ある朝、ショッピングモールの中央アトリウムでチェンに会った。干し草と花を積んだアンティークのシボレーのピックアップトラックの近くだ(「菊だよ」とチェンは満足そうに言った)。トランスレーターの値段(約400ドル)を伝えると、彼は懐疑的だった。「高すぎる」と首を横に振った。しかし、カリブー・コーヒーの外に座って実際に使ってみると、彼の懐疑心は感嘆に変わった。私たちは彼のスマホの百度翻訳アプリの横にトランスレーターを置き、交代で様々な言語で話しかけて、チェンを困惑させようとした。中国語では、トランスレーターはチェンのアクセントのついた「ミンニスダ」がミネソタであることを理解した。チェンは私の名前を「マーラ」と発音したが、トランスレーターは私の名前を受け取った。英語で話した時、どちらの翻訳ツールも「気分が落ち込んでいる」という比喩表現を扱えましたが、翻訳ツールだけが「ベッドの反対側で起きた」が私の気分に関するもので、足をどこに置いたかに関するものではないことを理解しました。最も魔法のような瞬間は、程が8世紀の詩人、張九齢の連句を朗読した時でした。百度はそれを「海上では月と月が時を同じくして」と意味不明に翻訳しました。翻訳ツールは正確で真に詩的な翻訳を提供しました。
明るい月が海の上に輝くように、あなたは遠くから私とこの瞬間を共有します。
チェンが広東語に切り替えたところ、結果はより複雑になった。(翻訳機は「英語」を表す慣用句を「鶏小屋」と理解した。)しかし、機器が広東語に対応しているという事実自体が、彼に感銘を与えた。
iFlytekの翻訳ミッションは、旅行者、ビジネスマン、都市部のエリート層を支援するだけにとどまらない。少数民族や、多くの人が北京語を話さない地方の人々向けの製品を開発し、方言への対応も常に改善している。2017年には、「方言保護計画」と呼ばれる計画を開始した。初めてこの計画に関するニュース報道を目にしたとき、私はオーウェル風のその名前に思わず笑ってしまった。中国共産党は何十年もの間、言語を名詞一つ一つ、動詞一つ一つ攻撃してきた。危険とみなす用語を検閲し、方言や少数民族の言語を貶め、北京語をイデオロギー的な戯言で叩きのめしてきたのだ(中国の文化評論家、李沱は、こうしたぎこちない言い回しを「1984年ニュースピーク」にちなんで「マオスピーク」と呼んだ)。テクノロジー企業もこの言語攻撃に加担してきた。
iFlytekの広報担当者は電子メールで、同社の方言対策の目的は「私たちのコミュニケーション手段を守ること」だと述べた。iFlytekは、北京政府による迫害の対象となっている少数民族が話すウイグル語とチベット語に特に力を入れている。チャイナ・デイリー紙によると、方言保護計画のプロモーションの一環として、幹部はiFlytek Inputのユーザーに、iPhoneが当たるチャンスと引き換えに母語で話す自分の声を録音するよう促したという。
iFlytekのキャンパスは合肥市の中心部から遠く離れた、殺風景なアパートが立ち並ぶ通りにある。1万1000人の従業員のうち、ほぼ半数が31エーカー(約13万平方メートル)の警備された敷地内で働いている。残りの従業員は中国各地のオフィスに分散しており、一部は世界各地にも拠点を置いている。シリコンバレーのテック企業と同様に、iFlytekはバスで従業員を送迎し、食事や娯楽を提供し、崇高なミッションを掲げている。キャンパスのいたるところ――壁、商品、しゃがみ式トイレの個室のドア――に「人工知能で世界を力づける」というスローガンが掲げられている。私が昨年春にそこを訪れた際、習近平国家主席の写真が迎えてくれた。
広報担当者にキャンパス内のカフェに連れて行かれ、タピオカティーを飲みながら雑談した。iFlytekのウェブサイトにはメディア関係者の連絡先が記載されておらず、私はカスタマーサービスに何時間も電話をかけ続けた末、ようやく今回の訪問を手配することができた。何度か行き詰まった後、担当者が私を気の毒に思い、広報担当者に繋いでくれた。そして、私の訪問依頼は受け入れられた。(その後、別の広報担当者が、iFlytekが米国での広報管理を委託しているワシントンD.C.に拠点を置くロビー活動会社、チャートウェル・ストラテジー・グループに送った質問リストに回答してくれた。)
ブロンドの木材に囲まれ、ホストが同社の消費者向け製品について説明している間、私はタピオカをすすっていた。彼女は、ベストが縫い付けられたフリル付きのシャツ、ぶら下がるイヤリング、厚底靴を履いていた。キュートで気まぐれ、そして滑稽ですらあるiFlytekの美学を反映した服装だった。同社の子供用コンパニオンロボット「アルファエッグ」の一種は、水玉模様と小さな触角を持ち、漫画風のエイリアンの声で話す。ドライバー用バーチャルアシスタント「フライングフィッシュ」は、広告ではスキューバマスクをかぶった愛らしいサメとして描かれている。病院向けに患者の質問に答えるロボットは、アニメ映画『ウォーリー』に登場する機械「イヴ」とC-3POを合わせた子供のように見える。 (「おそらく世界中のどの国民よりも、中国人はロボットが本当に好きなのです」と、医療アシスタントの開発を支援した研究所である中国科学院人工知能研究センターの陳小平所長は言う。)広報担当者の説明によると、iFlytekの製品はすべて利便性と楽しさを追求しているという。
中国では、特に言語に関しては、面白半分で楽しむことが転覆の手段となる。2000年代初頭、オンライン検閲によって特定の文字が禁止されると、コンピューターユーザーは同音異義語に切り替えて国家の監視を回避した。胡錦濤政権下で流行した毛沢東語の「和諧社会」という概念を揶揄するため、彼らは甲殻類について冗談を言った。 「ヘキシー(河蟹) 」は「ヘキシー(和諧)」と発音が似ている。「人民に奉仕する」は「人民を煙に巻く」になった。どちらも「wu」という音を含んでいる。これらの文字は、入力ドロップダウンメニューで隣り合わせだった。
ネット上の皮肉の蔓延に危機感を抱いた中央政府は、同音異義語などの言葉遊びを禁止するに至った。そのため、反体制派は他の発信手段に目を向けた。「活動家たちは、カメラや携帯電話で録画、視聴、そして配信することがより容易かつ安価になったことで、動画に新たな可能性を見出しました」と、ロンドン在住のチベット人人権活動家でサイト「High Peaks Pure Earth」の編集者を務めるデチェン・ペンバ氏は述べた。しかし、2000年代後半には、中国共産党は音声技術の習得に乗り出しており、これはiFlytekが消費者向け音声認識企業として成長していく過程と並行して進められていた。
2009年、中国公安部長官の孟建柱氏は合肥を訪れ、iFlytek本社を訪問した。中央政府のウェブサイトに掲載された報道によると、孟建柱氏はそこで「公安機関がテクノロジー企業と緊密に協力し、予防・制御システムを構築する」必要性について語ったという。中国共産党は過去10年間で監視能力を強化し、数百万台のカメラを設置し、電子IDカードとオンライン実名登録を導入し、テクノロジー主導の「スマート」シティを構築してきた。ヒューマン・ライツ・ウォッチによると、iFlytekの技術は、政府がこのデジタル監視ネットワークに音声信号を統合するのに役立っているという。
同社は、中国政府が推進する「軍民融合」と呼ばれる広範な取り組みの象徴的な存在です。これは、中国の技術革新を軍事力に活用することを目指しています。ワシントンD.C.のニュー・アメリカ安全保障センターで中国の人工知能を研究するエルサ・カニア氏は、「iFlytekは軍民融合に非常に積極的に貢献しています」と述べています。「同社には消費者向けアプリケーションを開発する側面もありますが、公共安全、警察、防衛関連のアプリケーションも重要なようです」。カニア氏が昨年議会に提出した証言によると、同社は人民解放軍に自社製品を推進しています。彼女はさらに、「消費者向けアプリケーションとその他の国家向けアプリケーションの間にファイアウォールや隔たりがあるかどうかは明らかではありません」と付け加えています。(チャートウェル・ストラテジー・グループを通じて連絡を取った広報担当者は、iFlytekは軍事技術を開発しておらず、同社のセキュリティ関連事業や、iFlytekの消費者向け製品を通じて収集されたデータが政府プロジェクトからファイアウォールで保護されているかどうかについてはコメントを控えたと述べています。)
中国共産党にとって、言論の監視は単なる検閲以上の意味を持つようだ。「音声や動画のデータ収集は、人物やネットワーク、話し方、関心事、そしてトレンドを特定するのに役立つ」と、キャンベラにあるオーストラリア戦略政策研究所サイバーセンターのアナリスト、サマンサ・ホフマン氏は述べている。
iFlytekは、大量の音声・動画データを精査し、コピーまたは再投稿されたファイルを識別できるシステムの特許を取得しました。特許では、この処理は「情報セキュリティと世論の監視において非常に重要」と説明されています。iFlytekは、「音声・動画データの分析は、人気曲の特定やスパム発信者の検出など、様々な用途に応用できる可能性がある」と回答しています。
しかし、iFlytekはセキュリティ業務を可能にしている。2012年、公安部はiFlytekからインテリジェント音声技術に特化した機器を購入した。公安部は、iFlytekの本社がある安徽省を、音声パターンデータベースの構築のための試験地域の一つに選んだ。これは、当局が声の音で話者を識別できるようにする、人々の固有の話し方をカタログ化したものだ。
このプロジェクトは、スピーカー、マイク、デスクトップタワーを備えたワークステーション「Forensic Intelligent Audio Studio」と呼ばれるiFlytek製品を活用しています。2016年の地方自治体調達発表によると、このユニットは約1,700ドルで販売されており、声の特徴に基づいて人物を識別できます。2013年にオンラインに投稿されたiFlytekのホワイトペーパーでは、声紋認識または話者認識を「遠隔操作可能な唯一の生体認証方法」と謳い、「防衛分野において、声紋認識技術は電話会話における主要な話者の有無を検知し、会話内容を追跡することができる」と述べています。ホワイトペーパーによると、このワークステーションは音声の断片を取り込み、200人の話者の音声と比較することで、2秒以内に話者を特定できるとのことです。
他の国々も、情報収集目的で声紋認識を利用しています。エドワード・スノーデン氏が漏洩した機密文書によると、国家安全保障局(NSA)は長年にわたり、テロリストなどの監視にこのツールを活用してきました。例えば、NSAのアナリストは、音声ファイルからサダム・フセイン、オサマ・ビン・ラディン、アイマン・アル=ザワヒリの身元を確認するために話者認識技術を使用しました。また、FBIにもこの技術に特化した研究部門があります。Nuance社はかつてNuance Identifierというシステムを販売しており、これにより法執行機関は「数百万の声紋を数秒以内に検索できる」と説明していました。米国刑務局は、受刑者の通話を監視するために声紋を収集・保管していると報じられています。
2017年、ヒューマン・ライツ・ウォッチはiFlytekの政府活動に関する詳細な報告書を発表しました。同団体の研究員であるマヤ・ワン氏は、同社のツールは共産党の「デジタル全体主義国家の構築」計画に不可欠な要素であると述べています。同社はこの非難を「根拠がなく不合理」だと非難しています。ワン氏は、iFlytekの音声生体認証技術は「個人の追跡と識別を可能にする」と述べています。ある時点で、中国語を取り戻し、コミュニケーションを容易にするという崇高な努力は、中国語を支配しようとする試みと区別がつかなくなってしまったのです。
同社は、米国の多くのテクノロジー企業と同様に、自社の技術は「最終用途に依存しない」と主張している。
iFlytekの活動は、共産党の支配に脅威を与える地域で特に疑惑の目を向けられている。その一つが、中国西部の文化的に独特な地域であり、人々が長きにわたり主権をめぐって争ってきた大チベットである。iFlytekはラサのチベット大学に音声・情報技術を専門とする研究所を共同設立した。同社によると、研究所の目標は「少数民族の方言の保存と理解を深め、チベット文化の保護に貢献すること」だという。同社はまた、「Dungkar(ドゥンカル)」というチベット語入力アプリも開発している。「Dungkar」は「ほら貝」を意味し、チベット仏教で縁起の良いシンボルとなっている。
ヒューマン・ライツ・ウォッチによると、アイフライテックの技術は、中国北西部に位置する新疆ウイグル自治区で監視活動を可能にしているようだ。新疆ウイグル自治区は、イスラム教徒が多数を占める少数民族ウイグル族が居住する地域である。近年、中国政府はウイグル族への締め付けを強めており、100万人以上を収容所に収容し、一部は工場で強制労働に従事させている。住民は携帯電話にベビーシッターアプリをインストールさせられたり、定期的な検問所で生体認証データを提出させられたり、自宅に文化検査官を招いたりしている。公式資料では、これらの検査官は皮肉を込めずに「姉と弟」と呼ばれている。
取り締まりが最も激しいのは、シルクロード沿いの古都カシュガルかもしれない。かつては主要な観光地だったカシュガルは、現在では少なくとも12の収容所が存在する。2016年、カシュガル警察はiFlytekの子会社と音声指紋端末25台の購入契約を結んだ。調達契約によると、この技術は写真、指紋、DNAサンプルを含む生体認証書類用の音声サンプル収集に使用される。子会社のウェブサイトによると、この子会社はカシュガル大学が「多民族」環境における「安全かつ安定した運営」を確保するため、キャンパスへのビッグデータ統合を支援したという。
2016年5月、iFlytekは新疆ウイグル自治区の刑務所を運営する機関と戦略的協力協定を締結しました。iFlytekの技術がこの協定でどのように活用されるかは正確には不明ですが、中国のプラットフォーム「捜狐」の投稿では、iFlytekの取り組みは「刑務所の安全と安定を確保する」と述べられています。
米国の学者グループが昨夏、北京でアイフライテック幹部と面会し、同社の新疆ウイグル自治区での活動について質問した。「彼は『言語能力を提供することで、政府がウイグル族をよりよく理解できるよう支援している』と述べた」と、その場にいたある安全保障アナリストは私に語った。
ヒューマン・ライツ・ウォッチのワン氏は、iFlytekが「無害な商用アプリケーションと監視アプリケーションの両方を開発しているという事実こそが、彼らを非常に問題視させる」と述べている。iFlytekの政府プロジェクトからのデータは、消費者向け製品の改善に利用される可能性が高い。そしてその逆もまた然りだ。「彼らは、商用アプリケーションだけでなく、軍事・警察アプリケーションからも収集された膨大なサンプルを使ってAIシステムを訓練し、改良することができるのです」とワン氏は述べている。旅行者がトランスレーターに話しかけるたびに、その言葉はアルゴリズムのブラックボックスに送られる。つまり、iFlytekの技術は、個人の声を重要な時間節約手段と、個人のアイデンティティを示す避けられないマーカーの両方に変えることで、中国をはじめとする世界の人々の生活を劇的に変える可能性を秘めているのだ。
近年、 iFlytekは国際展開の段階に入り、カナダ、ニュージーランド、そしてアメリカの大学との研究提携を仲介してきました。MITのCSAILとの契約締結に際し、研究所長のダニエラ・ラス氏は、この提携は「人間と人工知能の強みをより有効に活用する方法を模索することで、21世紀の最大の課題」への取り組みに重点を置くと述べました。しかし、この提携に対する批判はより冷笑的です。iFlytekはMITブランドの威信と引き換えに、金額を公表していない資金を提供したのです。
この発表は、ヒューマン・ライツ・ウォッチが新疆ウイグル自治区におけるiFlytekの活動を暴露してから8ヶ月後に行われた。教化キャンプの存在が広く知られるようになるにつれ、MITの研究者の中には不安を募らせる者もいた。CSAILの大学院生アラン・ルンドガード氏は、自身の研究がiFlytekから資金提供を受けることを知ったのは、同研究所に着任してからだったと語った。CSAILの担当者にメールで、同社からの資金提供に道義的な異議があることを伝えたところ、担当者は、研究のために別の資金源を見つけることができると返答した。もしそうしない場合は、既に受け取った資金を返還しなければならないとルンドガード氏は述べた。

超スマートなアルゴリズムがすべての仕事をこなせるわけではありませんが、これまで以上に速く学習し、医療診断から広告の提供まであらゆることを行っています。
昨年夏、性犯罪者ジェフリー・エプスタインとサウジアラビア政府がMITの他の研究室に資金提供していたことが報道で明らかになった後、学生と職員は一連の抗議活動を行い、CSAILと中国のテクノロジー企業との契約が一躍注目を集めました。「中国における監視活動への懸念は極めて現実的です」と、MIT計算心理言語学研究所の所長ロジャー・レヴィ氏は述べています。「MITは、他の組織と契約を結ぶ際には、その組織にある種の信頼性を与えているということを、非常に真剣に受け止める必要があります。」
10月、商務省はiFlytekを米国政府の輸出規制対象企業リストに掲載した。これに対し、劉青鋒氏はiFlytekのウェブサイトに中国語で反抗的な声明を掲載したが、政府との緊密な関係をめぐる認識を払拭するには至らなかった。「革命の殉教者たちが血を流さなければ、今日の現代中国は存在しなかっただろう」と声明には記されていた。「現代中国の繁栄と発展がなければ、iFlytekが産業舞台にデビューすることはなかっただろう…人工知能によって美しい世界を築くという我々の自信と歩みを止める力はない!」翌日、マイク・ポンペオ米国務長官は演説で新疆ウイグル自治区での弾圧に触れ、「ジョージ・オーウェルの『1984年』のページがそこで現実のものとなっている」と述べた。
昨年秋、CSAILの広報担当者はメールでの質問に対し、iFlytekのエンティティリストへの追加がMITによる審査のきっかけとなったものの、当面はCSAILとの提携を継続すると述べた。WIREDが4月にさらに問い合わせを行った後、MITは2月に関係を解消したと発表した。大学はその理由を明らかにしなかった。ルンドガードへの資金提供については、広報担当者は「研究所は研究遂行に利用可能な資金と研究者の個々の希望の間でバランスを取らなければならない」と回答した。
上海の友人にiFlytekの作品について話すと、彼女は中国のSF作家、馬伯勇の小説『静寂城』を思い出すと言った。物語の舞台は、言論が厳しく統制された未来社会。人々は新たな規制に巧みに適応し、検閲を逃れるために同音異義語や俗語に頼る。やがて当局は、言論を真に統制する唯一の方法は「健全な言葉リスト」を公表し、リストにない言葉はすべて禁止し、テキストだけでなく音声も監視することだと気づく。主人公は外出するたびに「リスナー」と呼ばれる装置を装着しなければならず、リストから外れると警告が鳴る。こうして、言論の自由が制限される領域は日に日に狭まっていく。
やがて主人公は秘密のトーキング・クラブの存在を発見する。鉛のカーテンで囲まれたアパートで、メンバーたちは言いたいことを言い、セックスをし、1984年について研究する。生き返った実感を得た主人公は、「話したいという強い欲求」を抑圧してきたことに気づく。この束の間の希望は、当局が鉛のカーテン越しに信号を傍受できるレーダーアンテナを開発したことで打ち砕かれる。物語の終盤には、健全な言葉は残っておらず、主人公は沈黙し、一人、考えながら街を歩き回る。「幸いなことに、当時はまだテクノロジーで心を守ることは不可能だった」とマーは記している。
中国の監視国家は、学者のジェイサン・サドウスキーが「ポチョムキンAI」と呼ぶもの、つまり万能に見えるが実際にはそうではない技術を時折利用してきた。しかし、実用レベルでは、その技術が宣伝通りの精度であるかどうかは、ほとんど問題にならない。国家がわずか数秒の傍受音声で自分の居場所を特定できるという印象を人々が抱くと、自己検閲を始める。ビッグ・ブラザーは内面化されているのだ。
今年4月、上海を訪れていた時、このことを思い出した。ある日、上海モーターショーを見るため、地下鉄に乗って、街の西端にある巨大な国家会展中心(エキシビション&コンベンションセンター)へ向かった。iFlytekも出展社の一つで、ブースに着くと、大型スクリーンに動画が流れていた。赤いセダンのハンドルを握る、清潔感のある若い男性が映し出されていた。「こんにちは、ピーター!」と声が聞こえ、ダッシュボードに取り付けられたスクリーンに彼の写真が映し出された。ピーターはまるで車が自分を認識するのをずっと待っていたかのように、満面の笑みを浮かべた。
ネオンカラーの背景に白い文字が次々と点滅し、まるでサブリミナルのように瞬く。あなたのニーズを理解し、あなたの感情を捉える。未来のインテリジェントなインタラクティブ・オートシステム。
邢小玲という店員が、私を小さなステーションに案内し、自動アシスタントを実際に試用させてくれた。ヘッドホンを装着すると、「フライングフィッシュ、こんにちは!」と彼女が声をかけると、画面が起動した。
「一曲聴きたい」と邢さんが言うと、甘ったるいポップナンバーが耳に流れ込んだ。彼女は北京行きの航空券を簡単な音声指示で買う方法を教えてくれた。これはAlipayまたはWeChat Payのモバイル決済アカウントを連携させたユーザーが利用できる機能だ。邢さんは、Flying Fishはいつでも対応してくれると付け加えた。
iFlytekのバーチャルアシスタントはしばしば「中国のSiri」と呼ばれているが、Xing氏はそうした比較は同社にとって不利だと考えていた。「Siriを使うと、毎回『ヘイ、Siri』と言わなければなりません」と彼女は言った。「とても機械的です」。米国では、Appleなどの企業は、自社のデバイスが常に聞き耳を立てているという認識と激しく戦ってきた。しかし中国では、それがセールスポイントだった。「一度起動するだけで、あとはちゃんと起動します」とXing氏はFlying Fishについて語った。
私はデジタルレコーダーで会話を録音し、彼女が話している間ずっとメモを取っていました。画面に目を戻すと、録音していたのは私だけではなかったことに気づきました。まさにそこに、未来のインテリジェントなインタラクティブ・オートシステムに、私たちの言葉がすべて記録されていたのです。
記事内の販売リンクから商品をご購入いただくと、少額のアフィリエイト報酬が発生する場合があります。 仕組みについて詳しくはこちらをご覧ください。
マーラ・ヴィステンダール (@marahvistendahl) は『科学者とスパイ』の著者です。彼女は27.05号で殺人依頼ウェブサイトについて最後に記事を書きました 。
この記事は6月号に掲載されます。 今すぐ購読をお願いします。
この記事についてのご意見をお聞かせください。 [email protected]までお手紙をお送りください。
WIREDのその他の素晴らしい記事
- インターネットを救ったハッカー、マーカス・ハッチンズの告白
- 最初の接種:新型コロナウイルスワクチンのファストトラックの内幕
- フォードの自動運転車を急ピッチで開発する、容赦ないスタートアップ
- マジック:ザ・ギャザリングの株式仲買人たちは本気でプレイする
- Zoomでは物足りない?バーチャル世界を探検してみませんか?
- 👁 AIがCOVID-19の潜在的な治療法を発見。さらに、最新のAIニュースもお届けします
- ✨ ロボット掃除機からお手頃価格のマットレス、スマートスピーカーまで、Gearチームのおすすめ商品であなたの家庭生活を最適化しましょう