Twitterでは、単純な「ha」では不十分な場合は、「hahahaaaa」や「haaaahaaaa」、さらには「hahahahahahahahahahahaha」という表現が使われる。これらは、これまで見た中で最も面白いものを読んだことを示す。(あるいは、皮肉たっぷりのおしゃべりなアライグマであることを示す。)これらは伸縮自在語または長音語として知られており、バーモント大学の研究者らがTwitter上でこれらがどれほど普及しているかを解明し、その使用に関する興味深いパターンを明らかにした。
伸縮性は、書かれた言葉を視覚的に強調し、幅広い感情を伝える強力な言語的手法です。サッカーアナウンサーの「ゴールーーーーー」 、ティーンエイジャーの苛立ちを込めた「やっとーーー」、サーファーの「最高ーーー」などもこれに当てはまります。そして、これらはTwitterで人気です。PLOS One誌に本日掲載された論文で、研究者たちは1000億件のツイートを精査し、これらの単語がどのくらいの頻度で伸縮されているか、そしてどの程度伸縮されているかをマッピングした方法を詳細に説明しています。例えば、「haha」と「hahahahaaaa」の違いなどです。
「dude」とその様々な表現を考えてみましょう。「これは基本的に何でも伝えることができます。例えば、『おいおい、それはひどい』のように」と、バーモント大学の応用数学者で、この研究の共著者の一人であるピーター・シェリダン・ドッズ氏は言います。一方、「Dude !」は違います。「興奮を表すことも、喜びを表すこともできます」とドッズ氏は言います。
しかし、強調や感情を表現するために感嘆符を使うことに抵抗がある人もいる。私もその一人だ。「感嘆符を使うのは嫌いです。自分の性格に合わないんです」と、ドッズ氏と、同じくバーモント大学の応用数学者である共著者のクリス・ダンフォース氏に言う。しかし、私は言葉を巧みに使う。「最近、友人や同僚へのメッセージで、Aを3つ使って「ありがとう」と書くようになったんです。くだらない感嘆符を使わずに、ある種の興奮や感謝の気持ちを伝えたいんです」
「たった3つ?」ダンフォースは尋ねる。「それは自制心だよ。だって2つじゃダメなんだから。2つだと、この人はスペルが分からない。間違えたって思われるんだから。」
ええと、私たちは悲しみ、怒り、興奮といった感情を伝えるために、伸縮性のある言葉をよく使います。そして、Twitterのようなプラットフォームでは、その簡潔さゆえに繊細なニュアンスを伝えることは難しいため、この伸縮性は特に大きな力を発揮します。こうした伸縮性のある言葉は、短いメッセージに迫力を与え、より注目を集める効果をもたらします。「辞書に載っているような文章を、視覚的に表現しているんです」とダンフォース氏は言います。「20文字もAが並んでいると、もう無視できません」
これを定量化するために、ドッズ氏、ダンフォース氏、そして論文の筆頭著者であるバーモント大学の計算言語学者タイラー・グレイ氏は、2008年から2016年の間に送信されたツイートの10%、つまり合計約1000億件をランダムに選択した(彼らはこのデータを入手するためにTwitterと契約している)。グレイ氏は、データから伸長語、特に繰り返し文字を探すプログラムを作成。
まず、どの文字が繰り返され、どれくらいの頻度で繰り返されているかを数値化しようとしました。例えば、gooooaaaaaal を例に挙げてみましょう。プログラムは「G を1つ見つけ、次に O を見つけます」とドッズ氏は言います。A と L も数えます。たとえ G を1つしか数えなくても、残りの文字は非常に繰り返しが多いことがわかります。おそらく O と A がそれぞれ20個ずつあるでしょう。「ですから、これは伸縮可能な単語の候補になりそうです」とドッズ氏は続けます。
システムはこれらの伸縮可能な候補を単純な表記法で表現します。gooooaaaal の G と L が重複していない場合、式は g[o][a]l のようになります。一方、 Gggooooaaaallllは各文字が重複しているため、[g][o][a][l] のようになります。
これは、研究者が伸縮性単語の「バランス」と呼ぶものを定量化したものです。Goooooaaaalは4つの異なる文字の繰り返し頻度が異なるため、あまりバランスが取れていません。一方、Hahahahahaは H と A が同じ頻度で繰り返されるため、非常にバランスが取れています。しかし、Haaaaaはバランスが取れていません。

イラスト: タイラー・J・グレイ、クリストファー・M・ダンフォース、ピーター・シェリダン・ドッズ
研究者たちは、上のグラフのように、文字ごとの平均繰り返し回数を視覚化することができました。Twitterで「goal」という単語が様々な形で引き伸ばされて表記されている中で、「G」はおそらく1回か2回繰り返されています。(サッカーのアナウンサーが「guh-guh-guh-guh-goh-oal」と叫んだら、どれほど早く解雇されるか想像してみてください。)このグラフでは、縦軸に文字数を、横軸に特定の文字の繰り返し回数を取っています。グラフの上から下に向かって単語が伸びていきます。しかし、「G」を見ると、単語が伸びてもその頻度はほとんど増加しません。対照的に、「O」、「A」、「L」は単語が伸びるにつれて繰り返し回数が増えていることがわかります。
これはGの音が破裂音、つまり口の中の空気の流れを止めて発音する子音だからです。「ああ」や「うーおー」のように引き延ばすことはできません。そのため、「ゴール」という単語の場合、母音が長くなり、互いに足並みを揃えて長くなる傾向があります。「私たちが事前に知らなかったのは、これらの行がかなり直線的だということです」とドッズ氏は言います。「ですから、140文字にしても80文字にしても、O、A、Lのバランスは実際にはほぼ同じになります。」これは、サッカーのアナウンサーの古典的な掛け声「Gooooooaaaaaaaaallllll」と一致しており、Gが軽く、単語の残りの部分が重なっています。

イラスト: タイラー・J・グレイ、クリストファー・M・ダンフォース、ピーター・シェリダン・ドッズ
さて、ha を考えてみましょう。退屈で、熱意に欠けるけれど、様々な形に伸びる銀河のような形をしています。上の画像で視覚化されているように、これを「笑いの木」と呼びましょう。一番上のHは、ツイートされた「ha」の始まりです。ツイート者が何らかの理由でAの代わりにHをもう一度追加すると、左に枝分かれします。中には最終的にAを追加してhha を作り、右に枝分かれする人もいますが、左端を見ると、先頭にHを追加し続けるとどうなるかが分かります。
画像の上部に戻ると、最初のHから右に移動するにつれて、ツイッターユーザーはhhhhaaaaではなくAを足してhahahahaと発音し始めています。これはより一般的な発音なので、文字をつなぐ線が太くなっています。例えば、haからhahへの発音は、 haからhaaへの発音よりも一般的です。一般的には、予想通り、すっきりとしていてバランスの取れたhahahahahahaと発音されます。haahaやhahhahのような異常な発音は、単なるタイプミスである可能性が高いです。

イラスト: タイラー・J・グレイ、クリストファー・M・ダンフォース、ピーター・シェリダン・ドッズ
一般的に、2文字の単語は、finallyyyyのように、普通の単語よりも語尾が長くなります。上記のツリーの単語も、予想通りの展開を見せます。Fuuuuuuは、この言語特有の怒りを表す一般的な表現です。「人々は F で始まって、その後に Us を重ねます」とダンフォースは言います。awwwwwww も同様です。
引き伸ばされた単語には、単語そのものを超えた多くの意味が埋め込まれている可能性があるため、チャットボットのようなテキストを分析する人工知能にとって、その意味を理解することは非常に重要です。現状では、引き伸ばされた単語はAIにとってあまりにも複雑であるため、プログラムがそれを完全に読み飛ばしてしまう可能性があります。チャットボットが解析できるように、単語を強調するために太字や斜体にする必要はありません。また、そうした書式設定では、引き伸ばされた単語が伝える感情の幅を再現することはできません。
「AIが人々が日常的に用いるコミュニケーションの範囲を理解できるようになるとしたら、今がまさにその段階の一つです」と、ブルームバーグのAIグループにシニアリサーチサイエンティストとして加わる前の2011年にTwitterの単語長延長に関する独自の研究を発表したサム・ブロディ氏は述べている。ブロディ氏は関与していないこの新たな研究は、長すぎる単語を定量化し、機械が理解できる微妙な言語ルールへと変換するための一歩となる。
一体誰が、注目を浴びたいファンからジャスティン・ビーバーを救うのでしょうか?研究者たちが気づいた奇妙な点の一つは、Twitterユーザーが有名人の注目を集めようと、極端に強調しようとする時、全てを長く伸ばすという点です。「二つ目の種類の言葉がありました」とドッズ氏は言います。「例えば、『fffffooooolllllllloooooowwwwww mmmmmmeeeeee、ジャスティン・ビーバー』のように。人々はF、O、Lを伸ばしたり、全部伸ばしたりしました。なぜなら、それがジャスティンにとって刺激的になるだろうという予感がしたからです。」
多分効かないだろう。でも、害はないから、やってみて。
WIREDのその他の素晴らしい記事
- 中国のAI大手がチャットと監視を容易にした方法
- インターネットを救ったハッカー、マーカス・ハッチンズの告白
- 宇宙打ち上げが失敗したとき、宇宙飛行士はどうやって脱出するのでしょうか?
- 遠く離れていても一緒に歌うことを学ぶ
- 裏庭をもっと楽しくする最高のギア
- 👁 脳はAIの有用なモデルとなるのか?さらに:最新のAIニュースもチェック
- 🏃🏽♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください