
ジェフリー・グリーンバーグ/UIG、ゲッティイメージズ経由
アメリカの路上を走る車は住民の投票行動を反映している。トラックよりセダンのほうが多ければ、票は民主党に傾くだろう。
これは、スタンフォード大学のティムニット・ゲブル氏とフェイフェイ・リー氏が率いる研究チームによるものです。彼らは同僚と協力し、米国200都市で撮影された5000万枚のGoogleストリートビュー画像に映るすべての車のメーカー、モデル、年式を認識できるようアルゴリズムを訓練しました。そして、それらの画像を「アメリカン・コミュニティ・サーベイ」と呼ばれる人口統計データベースと前回の大統領選挙の投票データと比較しました。この研究結果はPNASに掲載されました。
この研究では、畳み込みニューラルネットワークと呼ばれるディープラーニングとマシンビジョンのフレームワークが使用されており、この技術は車のモデルや年式間の微妙な違いを見分ける能力において人間よりも優れていると研究者らは主張している。例えば、ホンダ・アコードの2007年モデルと2008年モデルの主な違いはテールランプのわずかな変更である一方、フォード・F-150 スーパークルーの2001年モデルと2011年モデルはグリルの違いで見分けられる。
研究者らによると、このシステムは車両を2,657のカテゴリーにそれぞれ0.2秒の速度で分類できるという。「このシステムは5,000万枚の画像から2週間で自動車を分類したが、人間の専門家が1枚あたり10秒で同じ作業を行うと仮定すると、15年以上かかるだろう」と論文は指摘している。
もちろん、このアルゴリズムはまず訓練を受ける必要がありました。まず、Googleストリートビューの画像から車両を見つけるようにアルゴリズムに教え込み、その後、Amazon Mechanical Turkで雇われた人材と、Craigslistで募集した自動車専門家が自動車販売サイトの写真を見て作成した「ゴールドスタンダードデータセット」で訓練しました。最終的に、表示された車両の95%を識別できるようになりました。
車のデータを人口統計情報と比較したところ、「車両の分布と様々な社会経済的要因の間には強い関連性がある」ことが研究者らは述べている。アジア系住民の多い地域ではホンダやトヨタが好まれ、アフリカ系アメリカ人の居住地域ではクライスラー、ビュイック、オールズモビルが好まれ、ピックアップトラック、フォルクスワーゲン、アストンマーティンは主に白人が居住する地域を示唆していた。
そして、それは選挙結果にも影響を与えた。「例えば、街中をドライブ中に遭遇するセダンの数がピックアップトラックの数を上回った場合、その街は次期大統領選挙で民主党に投票する可能性が高く(88%)、そうでない場合は共和党に投票する可能性が高く(82%)」と研究者らは説明している。
このデータは、アメリカのコミュニティ調査(ACC)や選挙結果と比較され、その正確性が検証されました。研究者たちは、「私たちが調査したすべての人口統計において」強い相関関係が見られたと主張しています。しかし、実際の正確性はばらつきがありました。例えば、このシステムはウィスコンシン州の311の選挙区のうち264の票を正しく分類し、アリゾナ州ギルバートでは60の選挙区のうち58の票を正しく分類しました。
研究者たちは、こうした研究はより労働集約的な戸別訪問調査に代わるものではなく、それを補完し、初期結果の迅速化に役立つ可能性があると述べている。アメリカコミュニティ調査は年間2億5000万ドルの費用がかかり、完了まで2年半かかる。そして、この新しいデータは、車載カメラを搭載した自動運転車によってすぐに強化される可能性が高い。「例えば、テスラの車は現在、ここで調査されたのと同じ数の画像を毎日撮影している」と論文は指摘している。
ケンブリッジ大学ジャッジ・ビジネススクール心理測定センターの副所長で、ビッグデータと定量社会科学の講師を務めるデイビッド・スティルウェル博士は、この論文は「現在、大規模な画像分析で何が可能なのかを巧みに示している」と述べている。しかし、私たちが何を買うかに基づいて、人種、富、あるいは投票行動について推測するのはどれほど容易なことなのだろうか?「何百、何千もの選択肢から選択する状況は、私たち自身について何かを明らかにします」とスティルウェル博士は主張する。「もちろん、私がアストンマーティンを買えば、それは私がアストンマーティンを買うだけのお金を持っていることを明らかにするでしょう。」
もちろん、アストンマーティンが買えるなら、他にも選択肢はたくさんあり、そうした選択の背後にある心理的な理由から、私たちについて多くのことが分かります。洗練された印象を与えたいがためにアストンマーティンを選ぶ人もいるかもしれません。「だから、派手なフェラーリは避けるんです」とスティルウェルは言います。あるいは、プリウスに乗っている人に自分の価値観をはっきりと示したいのかもしれません。
彼は、この論文の予測は集団レベルでのみ適用可能であり、より正確な手法が存在する可能性もあると強調する。「著者らは、個人レベルではなく、郵便番号や選挙区の投票行動といった、全体的レベルでの予測を行っている。個人レベルでこれが通用するかどうかは疑問だ」と彼は言う。「純粋な精度で言えば、結果はそれほど高くない。おそらく、前回の投票における選挙区の得票率を見るだけでも、次回の投票を予測する上では良い指標となるだろう。」
言い換えれば、隣人が車を選ぶかどうかをあまり批判しないでください。
この記事はWIRED UKで最初に公開されました。