人間が他の動物界を支配するために好んで使うものの一つに、複雑な言語があります。確かに他の生き物たちは互いに会話しますが、人間には構文や「defenestrate(窓から投げ出す)」のような面白い言葉を持つ、非常に複雑な書き言葉があります。感情がなく、失敗しない能力がないだけでなく、小説も書けないロボットに対しても、人間は言語で優位に立つことができるのです。

小谷篤信
少なくとも今のところは。ブラウン大学の研究者たちは、ロボットに言語学的に不可能でありながら美しいことを実行させた。日本語の手書き文字を訓練した後、ロボットはその後、手書き文字の例を見るだけで、ヒンディー語、ギリシャ語、英語など、これまで書いたことのない言語の単語を書き写し始めたのだ。それだけでなく、英語の活字体と筆記体も書き写すことができた。そして、念のため、モナ・リザの絵も自分で書き写した。
二足歩行のように、手書きは一見シンプルに見えて、実は複雑な人間の魅力の一つです。単語を書くときは、どこにペンを置くか、どのくらいの長さの線をどの方向に引くか、そして時には文字の途中で(大文字のAのように)ペンを持ち上げて、またどこにペンを置くかを把握する必要があります。
ですから、子どもに文字を書かせるには、ただ見本を見せて自由にさせるだけではだめです。それぞれの文字の書き方を丁寧に指導する必要があるのです。「文字を作るには、どのような筆順で、どのような順番で書けばいいのか、ちょっとしたアルゴリズムを教えてくれます」と、ブラウン大学のロボット工学者ステファニー・テレックスは言います。テレックスは、同じくブラウン大学の小谷篤信氏と共同でこのシステムを開発した人物です。「そして、私たちのアルゴリズムはまさにそれを学習しているのです」
彼らの学習システムは2つの異なるモデルに分かれています。「ローカル」モデルは、ペンの現在のストロークで何が起こっているか、つまり正しい方向を定め、ストロークをどのように終わらせるかを担当します。そして「グローバル」モデルは、ロボットの筆記具を文字の次のストロークへと動かす役割を担います。
ロボットを訓練するために、研究者たちは日本語の文字コーパスを学習させ、文字を構成するストロークがどのように機能するのかに関する情報を提供した。「そこから、ロボットは基本的に、画像のピクセルを見て、次のストロークを始めるためにどこに移動する必要があるかを予測し、そしてストロークを描きながら画像を再現するためにどこに移動する必要があるかを予測するモデルを学習します」とテレックス氏は言う。
そこで研究チームは、ホワイトボードにヒンディー語、タミル語、イディッシュ語(いずれも独自の文字を使う)で「Hello」と書いて、ロボットを徹底的に混乱させようと試みました。驚くべきことに、ロボットは機械視覚でそれぞれの単語を読み取り、日本語しか書けないにもかかわらず、独自のコピーを書き上げることができました。さらに、英語の活字体に加えて筆記体も見せたところ、どちらも問題なく書きこなすことができました。
その後、幼稚園児たちが一団となってテレックスの研究室を訪ねてきました。まさかロボットが彼らの…下手な字を認識して再現するなんてできないでしょう? いや、いとも簡単に真似をしていました。「6歳児のぎこちない字をロボットが再現するのを見るのは、本当に驚きでした。今まで見たことも、訓練したこともなかったのに」とテレックスは言います。

小谷篤信
まさか、このロボットが小谷氏がホワイトボードに描いたモナ・リザのラフスケッチを真似できるはずがない。ところが、このロボットはそう簡単には真似できない。「あれは8月のことでしたが、その絵は今でも研究室のホワイトボードに残っています」とテレックス氏は言う。
しかし、完璧な人間などいません。研究者たちはロボットを左から右に書く現代日本語で訓練したため、システムは同じ方向に書く英語にも一般化できました。しかし、右から左に書く言語ではそれほどうまくいきませんでした。
それでも、これは言語の相互接続性、つまり同じ人間(そして今やロボット)の手から生み出された多種多様な文字体系の相互接続性を示す素晴らしい例です。そして、これは人間と機械の間の新たなコミュニケーション経路を切り開くための一歩でもあります。近い将来には実現しないかもしれませんが、将来的には、ヒューマノイドロボットが体からプリントアウトを吐き出すのではなく、手書きのメモを残してくれるようになるかもしれません。理想的には、「窓から投げ捨てろ!窓から投げ捨てろ!窓から投げ捨てろ!」といった不吉な言葉は避けたいものです。
WIREDのその他の素晴らしい記事
- 子どもたちのデジタルとアナログが融合した生活
- チェルノブイリ原発事故は楽園を築いたかもしれない
- 中国の大規模監視活動の内幕
- Bluetoothの複雑さはセキュリティリスクとなっている
- Squareの怪しい自動メールに激怒している
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください。
- 📩 毎週配信されるBackchannelニュースレターで、さらに多くの内部情報を入手しましょう