ティーカップで中国語に革命をもたらした囚人

ティーカップで中国語に革命をもたらした囚人

物理学者でエンジニアの志炳義は、「反動主義者」として投獄されていた間、コンピューターが漢字を読めるようにするシステムを考案し始めた。

中国語キーボード、毛沢東共産党集会、コンピューターの画像のコラージュ

写真イラスト: サム・ホイットニー、ゲッティイメージズ

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

1968年、文化大革命から2年が経った頃だった。上海は季節外れの猛暑に見舞われ、人々は「秋虎」を呪っていた。志炳義にとって、暑さよりも心配なことがあった。彼は「反動的な学界の権威」というレッテルを貼られていた。これは、文化大革命中に何百万人もの人々を死に追いやった、あるいは労働収容所送りにした数々の非難の一つだった。志がまだ自分を人民の一人だと考えるのは、果たして適切なことなのだろうか?彼は、言われていたように、人民を裏切ったのではないだろうか?

わずか4年前、智は政府の第一機械工業部傘下に新設された上海市電気計器研究室の所長として、毎日出勤していた。それは最も安定した仕事の一つだった。第一工業部は新中国初期に重工業機械の製造を担当し、後に電子通信技術を管轄する第四工業部として分離した。智の専門は電気計量器で、精密計量器と、機器の各種部品の性能を向上させる電子モデリングに特化していた。

物静かで慎重、そして粘り強い志は、高い資質も備えていました。ライプツィヒ大学で物理学の博士号を取得しましたが、アメリカでの就職の申し出を断り、中国に帰国しました。彼は中国の2つの大学で教鞭をとり、後に1956年に中国で画期的な12ヵ年科学技術発展計画の策定に貢献しました。国家主導の社会主義経済において、貢献できるとみなされた科学者や技術者にとって、それは希望に満ちた時代でした。

1968年7月に「反動的な学界の権威」として逮捕されて以来、志は研究、ニュース、そして献身的なドイツ人の妻から切り離されていた。同僚たちとチームを組んで方程式や工学の問題に取り組むことに慣れていたが、もはやそうではない。彼の唯一の友は、独房の壁に書かれた8文字だけだった。その文字は、囚人に対して看守が二通りの選択肢を提示していることを彼に思い出させていた。「自白する者には寛大に、拒否する者には厳格に」

知識階級の粛清は始まったばかりで、教育を受けた者は皆、階級闘争の教義と中国共産党の過激派である四人組の意志に屈服しなければならなかった。多くの人々が地方に送られ、過酷な労働を通して更生させられた。暑さと雨の中、食料もほとんどない中で、肥料を拾い集め、休耕地を耕すという過酷な労働を強いられた。彼らは「再教育」センターを兼ねた収容所で、最も厳しい軍規に縛られた。毛沢東の反知性主義運動は大成功を収め、ポル・ポトは1975年から1979年にかけてカンボジアで同様の運動を開始し、ブルジョア的知識人主義の証拠として眼鏡をかけている者を殺害した。

牛小屋の中で、志は壁に書かれた八つの文字を見つめていた。ある日、彼はもはや不吉なメッセージではなく、それを構成する筆跡と文字に目を留めるようになった。文字の端で、墨が濃くなったり、滲んだり、かすれたりする箇所に気づき始めた。一筆一筆が彼には新しく見え、一つ一つが新たな謎を抱かせる謎だった。人間の手で書かれた文字であっても、それぞれの文字は本質的に同じ抽象的な筆跡と点の組み合わせを繰り返しているのだと彼は悟った。

人間の筆致を、計算機に入力可能なコード化された言語へと翻訳し、変換するにはどうすればいいのだろうか?もちろん、漢字を体系的にコード化しようと考えたのはこれが初めてではない。同じ疑問は、1世紀以上も前に、別の牢獄――帝都北京の尿まみれの独房――で、デスケイラック伯爵の頭をよぎったこともあった。そして1925年には、パリの大理石の広間で、コード化された言語は国家主権の問題として激しく擁護され、電信暗号として利用されることも試みられた。 

しかし、機械のための解決策を考え出すことは、彼らの誰一人として思いつかなかっただろう。彼らの解決策はすべて、人間のユーザーを念頭に置いていた。つまり、文字をいかに整理すれば、人間が書きやすく、覚えやすく、覚えたり調べたりするのにかかる時間や労力が少なくなるか、ということだった。しかし、志の頭の中で燃え上がった疑問は、別の目的へと向かった。中国語をコンピューターが読める言語、つまり二進法の0と1で表すにはどうすればいいだろうか? 電気機器のコンピューターモデルを作ることに慣れていた彼は、この問題に何度も遭遇したはずだ。

1970 年代の先進国の技術水準に追いつくため、中国は大規模計算を処理し、膨大な量の情報をふるいにかけ、複雑な操作を調整できるマシンの構築を開始した。飛行経路、軍事目標、地理的位置の計算と制御、または農業と工業の生産高の追跡のためのデータが最初に収集される必要があった。しかし、既存の記録、文書、レポートはすべて中国語で書かれていた。そもそもコンピューティング時代に参入するためには、中国語の文字をデジタル化する必要があることは明らかだった。西側諸国のコンピューティング技術も、大規模計算の実行だけでなく、テキスト処理と通信の方向に進んでいた。人間の言語の文字をデジタル形式に変換することが次のフロンティアだった。冷戦期の軍拡競争は、ソ連と米国の両方でコンピューティング技術の状態を進歩させていた。中国語をマシンに取り込むことは、中国が取り残されないために不可欠だった。

正確な入力を要求する計算機は、矛盾や例外を許さない。初期の革新者を阻んできた中国語の特徴――文字数の膨大さ、複雑な筆画、声調、同音異義語、分節化の難しさ――は、文字のデジタル化において新たな課題を生み出した。実行可能なコマンドは、コンピュータ制御盤の回路を流れる電流のオンオフのような、イエスかノーの形でしかなかった。部分的な解決策やパッチでは、今回は中国を乗り切ることはできないだろう。志が投獄されていた当時、中国はかつてないほどの社会的・政治的激変の真っ只中にあり、未来に向けてそのような試みを行うための資源はほとんどなかった。しかし、西洋諸国から大きく遅れをとっていた中国にとって、科学技術は単なる障壁ではなかった。科学技術は、中国が後進性から脱却し、近代化のプロセスを加速させるために不可欠と考えられていたのだ。課題は多面的でした。人間が覚えやすく使いやすく、パンチテープやキーボードで機械に入力できる中国語コードを考案すること、中国語の文字を識別して再現するために必要な膨大な量の情報を機械が保存する方法を見つけること、そして、紙や画面上で文字を正確に検索して復元できるようにすることです。

ジーは、最初の重要なステップ、つまり中国語を機械に最も効果的に入力する方法に取り組めると確信していた。つまり、各文字を人間と機械の両方が理解できる言語で表現する方法を見つけ出す必要があった。機械に直接入力する有限の0と1の集合として表現するか、あるいは既にコンピュータプログラミング言語が構築されているアルファベット文字として表現するかだ。後者の方が有望に思えた。しかし、文字をアルファベットにマッピングすると、すぐに別の疑問が浮かび上がった。1つの文字を一意にエンコードするには、アルファベット文字はいくつ必要だろうか?文字の綴りは頭字語のように省略すべきだろうか?そして、頭字語の基盤となるべきものは何だろうか?文字、構成要素、それとも画数だろうか?

ジーはそれぞれの仮説を検証するためにペンと紙が必要だったが、警備員は書く物どころかトイレットペーパーさえ与えてくれなかった。部屋を見回すと、唯一使える物――ティーカップが目に入った。このささやかな崇拝の器と共に、ジーは自身の巡礼の旅に出た。毎日、盗んだペンでマットな陶器のティーカップの蓋に、できる限り多くの文字を刻み込み、ローマ字の候補となる文字を使って文字を一つ一つ試し、そして拭き取った。彼は記憶を頼りに、刻み込んだ文字を刻み続け、一度に数十文字を湾曲した表面に刻み込んだ。

彼は、すべての文字がそれを表すアルファベットコードと何らかの直感的かつ独自の関係を持つことを目指しました。そのためには、音と形状の2つの方法が知られていました。志の先人たちは、字画や構成要素を分類可能なカテゴリーに再配置する形状に基づく分析を好みましたが、ピンインというローマ字表記の導入により、音声に基づくアプローチが国内および国際的な言語標準化政策となりました。ピンインは音声標準化の問題を解決しましたが、従来の問題が解消されたわけではありませんでした。まず、多くの文字がアルファベット表記で同じ綴りになったため、同音異義語の問題が悪化しました。アルファベットの26文字では、異なる文字の発音を綴る方法は限られており、数千種類もの異なる文字よりも早く使い果たされてしまいました。志は、音声によるローマ字表記と形状に基づく手がかりを最大限に活用し、独自のエンコードプロセスを可能な限り予測可能で論理的なものにすることを決意しました。このアイデアは、獄中で朽ち果てるような運命ではなかったのです。

1969年9月、志は14ヶ月の刑期を終えて釈放された。釈放後、志は更生の一環として、床掃除、工場での工具の成形、倉庫の警備といった低級な仕事に配属された。彼は無名であることに喜びを感じ、すぐに元の文字体系に戻った。倉庫を書斎として使い、かき集めた外国の学術論文や新聞を保管していた。日本がこの問題の解決に向けて進展を見せていることを知り、彼は興奮した。中国のタイプライターと同様に、日本では文字の部首を使って文字を検索、検索、そしてコンピュータ画面上で印刷していた。しかし、日本語のキーボードには3,600以上の文字があり、それぞれが1つのキーを占めていたため、実用的ではなかった。オーストラリアのある会社も、部首を使った検索システムを採用していた。33キーのより簡素なキーボードを使って、1つのキーを押すだけで200近くの文字にいつでもアクセスできた。これは日本語よりは進歩していたが、中国語ではまだ文字数が足りなかった。アメリカでは、実験的なモデルが44個のキーを使用していました。そして、後にジーが知ることになるのですが、マサチューセッツ州のグラフィックアート研究財団では、中国語の印刷をコンピュータ化するという、さらに野心的なプロジェクトが進行中でした。一方、台湾の学者たちは、伝統的な文字のための独自の入力システムを開発していました。

志は大いに勇気づけられた。彼の孤独な研究は、これらの大規模な取り組みと並行して進められていた。しかし、それらのほとんどは、まだ使いにくいキーボードから抜け出すことができていなかった。文字を構成要素に分解することは、特定の文字検索インデックスやタイプライターのキーボード設計には十分に機能していたものの、計算機上でそのような処理をプログラミングすることには直結しなかった。

ジーは、文字の構成要素が文字全体を直接識別するのに役立つ、形状に基づくアプローチの利点を思い出しました。この有用な原理を自身の符号化方式に組み込むため、ジーは各構成要素のピンイン表記の最初の文字を用いて、各表意文字を構成するより単純な文字で文字を索引付けすることにしました。

このアイデアを具体化するのにさらに 2 年かかりました。平均して、文字は 2 ~ 4 つの要素に分解でき、合計で 300 ~ 400 の要素があります。ほとんどの文字は、他の形状とともに、垂直または水平の 2 つの半分に分割できます。これにより、各文字に対して 2 ~ 4 文字のアルファベット コードが生成され、従来の英語キーボードでは各文字を最大で 4 回押すだけで済みました。比較すると、英語の平均的な単語の長さは 4.8 文字近くです。 Zhi はこのようにして、英語の場合よりも個々の表意文字に対してアルファベットをより効率的に機能させました。このシステムは、方言の違いや同音異義語の問題も巧みに回避しました。コードは文字全体の音ではなく最初の文字だけを使用するため、ほとんどの地域的な話し言葉の違いは問題になりませんでした。4 文字のコードは、文字のさまざまな部分の頭字語のように機能しました。Zhi は基本的に、単語ではなく要素で綴るためのプロキシとしてアルファベットを使用しました。

彼は各文字の構成要素を、手書きで書かれた順序で並べました。構成要素ごとにコード化することで、文脈と重要な手がかりが得られ、曖昧さやコードの重複リスクが軽減されました。同じ構成要素、あるいは同じ文字で始まる構成要素が、2つの異なる文字に全く同じ順序で現れる可能性は低いのです。

志が漢字をアルファベット順の要素で索引付けする方法により、人間は中国語の書き方さえ知っていれば、中国語を入力しやすくなり、より体系的なヒューマンマシンインターフェースが生まれました。たとえば、彼のシステムでは、「道」を表す文字「路」( lu ) は、手書きでは 13 画ですが、「口」( kou )、「止」( zhi )、「攵」( pu )、「口」( kou ) のわずか 4 つの要素に分解できます。各要素の最初の文字を分離すると、文字コードは KZPK になります。また、一般的な名字である「吴」( wu ) は、「口」( kou ) と「天」( tian )の 2 つの部分に簡単に分解でき、文字コードは KT になります。

かつて中国語がこのように媒介していたアルファベット表記は、もはや音声ではなく意味的な表記体系であり、各文字は音ではなく文字そのものを表しています。この索引付け方法は、文字のグループを表すためにも拡張できます。例えば、「socialism」(社会主义)を考えてみましょうこのフレーズを構成する4つの文字それぞれの最初の文字にタグを付けることで、4文字のシーケンスSHZYでコード化できます。あるいは、頻繁に使用される別のフレーズ、「People's Republic of China」(中華人民共和国)を構成する7つの文字、Zhonghua renmin gongheguo(中華人民共和国)を考えてみましょう。これは単にZHRMGHGと入力できます。

志の符号化システムは、厳密に音声的ではない特性も含む可能性があります。文字を追加することで、基本的な4文字の構成要素に基づくコードに、文字全体の発音や形状パターンを追加できます。「路」という文字は「lu」という音声発音を持ち、縦に2つに分割できるため、左右 zuo-you)構造を持ちます。これらの特徴は、拡張コードKZPKLZで示すことができます。文字情報をより正確に符号化できればできるほど、そのコードはより有用になります。志のシステムのこれらの拡張は、機械翻訳や保存データからの情報取得といった中国語アプリケーションにとって重要となるでしょう。

1978年、Zhiは中国の科学誌『ネイチャー』で「オンサイト」符号化システムを正式に発表しました。彼はこのシステムを位相幾何学的、つまり部品の幾何学的形状から外挿されたものだと説明しました。アルファベット26文字すべてを用いた4文字コードでは、456,976通りの固有のコードを生成できるほどの組み合わせがありました。Zhiは、このシステムはモールス信号に匹敵する効率性、つまり迅速で直感的で透明性が高いと主張しました。

1976年の毛沢東の死後に勃発した科学技術に対する政治的熱狂に刺激されて、志の偉業のニュースは広まった。1978年7月19日の上海の文匯日報の一面で、編集者は興奮気味に「中国語の文字がコンピューターに入った」と発表しました。

コンピューターはついに四角い文字を「理解」できるようになった。10年以上の孤立を経て、中国はついに世界とコミュニケーションを取り、デジタルで自国の情報の流れを管理するチャンスを得たのだ。



WIREDのその他の素晴らしい記事

  • 📩 テクノロジー、科学などの最新情報: ニュースレターを購読しましょう!
  • カイ・レニーのメタバース崩壊人生
  • インディー都市建設ゲームは気候変動に配慮している
  • 2021年の最悪のハッキング:ランサムウェアからデータ侵害まで
  • VRで働くって実際どんな感じ?
  • 責任ある占星術をどのように実践しますか?
  • 👁️ 新しいデータベースで、これまでにないAIを探索しましょう
  • ✨ ロボット掃除機からお手頃価格のマットレス、スマートスピーカーまで、Gearチームのおすすめ商品であなたの家庭生活を最適化しましょう