人間の誤りやすさとロボット野球審判の必要性

人間の誤りやすさとロボット野球審判の必要性

「ギャンブラーの誤謬」とアンカリングバイアスがストライクゾーンに及ぼす影響。

データラインで分析した野球

イラスト: ケイシー・チン

WIREDに掲載されているすべての製品は、編集者が独自に選定したものです。ただし、小売店やリンクを経由した製品購入から報酬を受け取る場合があります。詳細はこちらをご覧ください。

私自身は、少なくともボールとストライクの判定に関しては、ロボット審判の導入を歓迎します。自動ストライクゾーンは、おそらく今後3シーズン以内に実現するでしょう。そして、私はそれを強く支持します。

野球シーズン中、特にここ数年のポストシーズン中に Twitter を少しでも利用したことがあるなら、野球でボールとストライクの自動コールに移行すべきかどうかという進行中の議論の両陣営である、#RobotUmpsNow を主張するファンと「人間的要素」を主張するファンの対立に遭遇したことがあるだろう。(これはほろ苦い話題である。この時点でストライクのコールが見落とされれば、また本物の野球が見られることになるので、私は死ぬほど欲しいくらいである。) これは 2019 年のワールド シリーズでも再び取り上げられ、第 5 戦で審判のランス バークスデールが 2 つの明らかなコールを見逃した。そのうち 1 つはバークスデールがワシントンの捕手ヤン ゴームズのせいだと公然と非難したため、ナショナルズの監督デイビー マルティネスはバークスデールに「目を覚ませ」と叫んだ。もう 1 つはあまりにひどいもので、ストライク ゾーンにも入っていない投球でバークスデールがアウトを宣告した後、被害者のビクター ロブレスが激怒して飛び上がってバッティング グローブを投げつけたどちらの判定も誤りで、どちらの場合も、バークスデール監督がナショナルズを罰しているという印象が少なくともあった。ストライク判定を事前に想定していたゴメスを罰し、その後、そもそもゴメスに疑問を呈したチーム全体を罰したのだ。単なる「人為的ミス」だったのかもしれないが、その認識はさらに悪かった。

『The Inside Game』の表紙。野球ボールの極端にクローズアップされた

私はあからさまに前者の立場です。ボールとストライクの判定は難しい仕事で、人間がうまく判定するのは事実上不可能です(特にキャッチャーというもう一人の人間が邪魔をしている場合はなおさらです)。ほんの数回の誤判定が試合やシリーズの行方を左右することもあります。これには実際的な反論もあります。例えば、既存の投球追跡技術が優秀な審判よりも確実に正確であるわけではない、といった点です。しかし、後者の主張、つまり「人間的要素」のために選手以外の人間が試合結果に影響を与えることを容認するという主張は、全くのナンセンスです。人間は多くのバイアスに左右されるので、人間がこれらの判定を行うべきではありません。

審判にも少なくとも2つの点で偏りがあるという証拠があります。ここで私が言っているのは、デイビー・ストライクスローワーがプレートから1、2インチ外れた投球に対して常に有利な判定を受けるとか、ジョーイ・バゴドナッツが審判に不満をぶつけられるせいで打者として頻繁にスクイズを受けるといった、選手特有の偏りのことではありません。こうした偏りは存在するかもしれませんし、自動化システムがあれば解消されるでしょう。しかし、その偏りを裏付ける証拠はそれほど強力ではなく、その影響は普遍的ではありません。

私が話しているのは、認知バイアスによって審判が常にミスを犯す 2 つの非常に具体的な方法です。これらのミスは、選手や審判に特有のものではないため、はるかに広範囲に及んでいます。

人間であれば、こうした認知的問題を抱えているはずです。審判は投球直後にボール/ストライクの判定を下すよう求められており、たとえ考え直したとしても判定を変更する余地はほぼないため、判定を間違えた場合でも修正する手段がありません。これは人間の審判を使うことのバグではなく、特性です。

人間の審判に関する最初の既知の問題は、彼らの投球判定が、特に直前の投球の判定によって偏ってしまうことです。ある投球のボール/ストライク判定が、前の投球によって影響を受ける理由はありません。投球は独立した事象であり、たとえ少しでも正確に、ある投手が次の投球でボールを投げるかストライクを投げるかを予測できれば、その投手はあまりにも予測可能であり、打者はその投手に気付くでしょう。

2016年に発表された論文で、ダニエル・チェン、トビアス・モスコウィッツ、ケリー・シューの3氏は、メジャーリーグベースボールのPitch f/xシステムで追跡されたすべての投球の研究で結果を報告している。このシステムは、2008年から2012年まで、すべての試合で投球がすべて追跡され、投球の位置、垂直方向または水平方向の動き、リリースポイントなどのデータが記録された。彼らは、審判によって「コール」された連続した投球、つまり、打ってプレイにならなかった、ファウルになった、空振りした、または審判によって判定されなかった投球を調べ、そのようなペアを90万組見つけた。彼らはまた、コールされたすべての投球を明白なもの(投球がボールまたはストライクであるという状態が明らかである)または曖昧なもの(ストライクゾーン上またはその付近にある投球)に分類した。彼らは、「明白な」投球の99パーセントが正しくコールされたのに対し、「曖昧な」投球はわずか60パーセントだったと報告している。

研究チームはまず、審判が1球目をストライクと判定した場合、2球目をボールと判定する可能性が高くなるかどうか、つまり、前の球の判定が次の球の判定にバイアスを与えるかどうかという具体的な疑問から着手した。その結果、すべての球種において、小さいながらも有意な影響が認められた。前の球をストライクと判定した場合、審判が2球目をボールと判定する可能性は0.9%高く、前の2球がストライクと判定された場合、その影響は1.3%にまで上昇した。この影響は、次の球が「曖昧」な場合により顕著で、「明白な」球の場合よりも10~15倍も大きかった。

著者らはこれを「ギャンブラーの誤謬」の現れだと分類している。これは、ランダムな結果、あるいは半ランダムな結果でさえ、有限のサンプルでは必ず均等になるという誤った信念である。例えば、ギャンブラーはルーレットで5回連続で黒が出た場合、ルーレットが「期限切れ」なので次の回転では赤が出る可能性が高いと主張するかもしれない。ちなみに、これは打席で調子が悪い打者についてよく聞く話だが、これも同様に馬鹿げている。著者らはまた、審判が各試合で一定数または一定の割合のストライクをコールしなければならないと感じるような、自主的なノルマ設定の可能性も指摘している。

アンカリング効果という別の認知バイアスは、より単純な説明を提供します。次の決定とは無関係な過去の情報が、特定の結果の確率に対する心の推定を変化させることで、次の決定に影響を与えます。審判の前の投球の判定は、次の投球の判定や、次の投球で正しい判定を下す確率に影響を与えるべきではありません。しかし、審判はこのバイアスに気づいていないかもしれませんが、この二つの出来事を独立したものとして扱っていないため、実際には影響を与えてしまいます。これは、内なるノルマ、「前の投球はストライクと判定したので、バランスを取ろうと努力すべきだ」という問題かもしれません。あるいは、潜在意識の期待かもしれません。

「前の投球はストライクだった。投手が2球続けてストライクを投げる可能性は低い。だから、この投球はボールになる可能性が高い。」原因が何であれ、最も単純な説明は、審判の意識が最後のストライクに縛られ、次の投球に対する審判の内的調整が狂ってしまうというものだ。つまり、次のストライクを正しく判定する可能性が低くなるのだ。そして、これもまた、ボールとストライクの判定を人間ではなく機械に委ねるべき理由の一つとなる。

アンカリング効果は、1974年にトヴェルスキーとカーネマンによって「不確実性の下での判断」という控えめなタイトルの画期的な論文で初めて提唱されました。「調整とアンカリング」というセクションは、一見当たり前のように聞こえるものの、多くの意味を秘めた次のような一文で始まります。「多くの場合、人々は初期値から推定を行い、それを調整することで最終的な答えを導き出します。」

何かを見積もるよう求められたとき、あるいは自分で見積もらなければならない状況に陥ったとき、思考プロセスを白紙の状態から始めるわけではありません。まず、関連性があると心の中で判断した情報から始め、そこから他の要因や気分に応じて調整を加えていきます。これは、人気ゲーム番組「ザ・プライス・イズ・ライト」を彷彿とさせるメンタルゲームです。この番組では、参加者は商品の値段を提示され、実際の値段がそれより高いか安いかを答えるように求められます。(ゲームによっては、参加者に値段の特定の桁を調整するよう求めますが、これはアンカーと調整のゲームの中にアンカーと調整のゲームがあるような感じです。) 心は最初のアンカーを設定し、手近な数字を掴み、そこから調整していきます。

彼らの論文で最も衝撃的な結果は、被験者の脳が全く無関係な数字を推定値のアンカーとして用いることを示した。彼らは被験者の前で0から100までのランダムな数字を示すホイールを回し、次に被験者に国連加盟国のうちアフリカ諸国が何パーセントいるかを尋ねた。彼らは次のように記している。「例えば、出発点として10と65を与えられたグループでは、国連加盟国のうちアフリカ諸国が何パーセントいるかの中央値推定値はそれぞれ25と45だった。正確さに対する報酬はアンカー効果を低下させなかった。」(1973年にこの研究が行われたと仮定すると、正解は32パーセントだっただろう。)

彼らはこれを「不十分な調整」と表現したが、実際には「不十分なアンカリング」に近い。この用語は、2つ目の実験によく当てはまる。2つ目の実験では、高校生2グループに8桁の積を計算してもらい、5秒を与え、その時点での答えを推測するよう指示した。一方のグループには8×7×6×5×4×3×2×1と答えを、もう一方のグループには1×2×3×4×5×6×7×8と答えを与えられた。最初のグループの推測値の中央値は2,250で、後者のグループは512だった。

『予想通りに非合理的』の著者ダン・アリエリーは、マサチューセッツ工科大学で同僚のドラゼン・プレレックと共同で行った同様の実験について述べている。その実験では、学生たちに何かの品物に入札するよう求めるが、まず社会保障番号の下2桁を、その品物の定価であるかのように書き写すように指示した。50以上の数字を書いた学生は、50以下の数字を書いた学生の3倍以上の金額で入札した。アンカーは無意味だった。目の前の問題と全く無関係だったため、学生たちの脳には全く影響がなかった。数字は目の前にあったため、学生たちはそれをアンカーとして、上下に調整したのだ。

アンカリングと調整は、脳に流れ込む膨大な情報量と、私たちが下すべき数々の意思決定に対処するために日々使っている、数ある認知的ヒューリスティック、つまり精神的な近道の一つです。スーパーマーケットで6時間かけて、それぞれの商品が自分にとって最適な価格に見合っているか、あるいはそれを下回っているかを調べることはできません。また、6軒のスーパーマーケットでそれぞれ1時間かけて価格を比較検討することもできません。私たちは価格が適切かどうかを即座に判断しますが、その判断は誤った情報によって歪められてしまうことがあります(例えば、セール中の商品は、他の店と比べて必ずしもお買い得ではないかもしれませんし、通常価格からそれほど割引されていないかもしれません)。

審判員は、ほとんどの判定を最大でも2秒程度で下すように求められています。もしそれ以上の時間がかかった場合、ダッグアウトの誰か、そしておそらくアナウンサーの誰かが「判定が遅れた」と騒ぎ立てるでしょう。彼らはヒューリスティックを用いて、ボール/ストライクの判定を少し速く下しており、その判断は、本人も気づいていないかもしれないが、ある程度のヒューリスティックを用いているのです。少なくとも私の仮説は、審判員は前の投球、あるいはその前の数球からアンカーリング(基準点を定めて調整する)を行っているということです。つまり、彼らの判定に見られるバイアスの証拠は、根深い人間の認知エラーの結果なのです。

野球におけるアンカリングバイアスの現れ方についてさらに論じる前に、ホームプレート審判の投球判定に影響を与えるもう一つの認知エラーについて触れておきたい。トビアス・モスコウィッツとL・ジョン・ワートハイム著の素晴らしい著書『スコアキャスティング:スポーツのプレーと試合の勝敗に潜む隠れた影響』を読んだことがあるなら、すでにご存知かもしれない。この本は、ホームフィールドアドバンテージからNFLドラフト指名権の価値、「守備が優勝を左右する」かどうか、そしてシカゴ・カブスがなぜ呪われているのかまで、複数のスポーツにおける問題をフリークノミクス風に考察している。(実際にはそうではなかったが、それでも良い本だ。)

モスコウィッツ氏は、先ほど引用した審判の正確性とバイアスを調査した2016年の論文の共著者です。彼と共著者が発見した2つ目の効果(これもScorecastingで報告されています)は、打者が四球を選ぶような投球を審判がボールと判定する可能性が大幅に低く、三振になるような投球を審判がストライクと判定する可能性も低いというものでした。モスコウィッツ氏と共著者はこれを「インパクト回避」と呼んでおり、これは何もしないことへのバイアスと考えることができます。(実際、これは別のバイアスである「省略バイアス」と近い関係にあります。省略バイアスとは、結果が同じであっても、何もしないことの方が何かすることよりも害が少ないと考えるバイアスです。)

Scorecastingで、著者らは2007~2009年のシーズンの投球コールと投球位置に関する Pitch f/x データを調べ、サンプルには115万球が含まれた。全体的な状況では、審判は85.6パーセントの確率で正しくボール/ストライクをコールしていることがわかった。しかし、打者のカウントが2ストライクになり、3球目は三振となり、投球がストライクゾーン内にあった場合、審判が投球をストライクと正しくコールしたのはわずか61パーセントの確率だった(フルカウントの場合は、ストライクまたはボールがコールされれば打席が終了し、インパクトアベイラビリティが働かなかったため、除外した)。これらの状況では審判のエラー率が2倍以上になったが、これは審判が、他のコールされた投球よりも影響の大きい決定を少しでも避けたためと考えられる。

逆の状況、つまり打者が3ボールカウントで投球がストライクゾーン外だった場合も、この衝撃回避の証拠を示した。審判はストライクゾーン外の投球を87.8%の確率でボールと正しく判定したが、3ボールカウント(フルカウントを除く)ではわずか80%しか正しく判定しなかった。野球用語で言えば、審判は2ストライクでは投手をスクイズし、3ボールではストライクゾーンを広げる。

さらに、彼らは、インパクトアファーメーションの証拠は、ボールのストライクカウントのスペクトルの両端で最も高かったことを実証しました。審判は、3-0カウントで誤ってボールをストライクと判定する可能性がはるかに高く、0-2カウントでストライクゾーンにある投球をボールと判定する可能性がはるかに高くなります。野球をよく見たことがある人なら、これは驚くことではありません。3-0カウントほどギフトストライクの判定を受ける可能性が高い場所はありません。2010年にHardball Timesに寄稿した記事で、ピッチf/xの専門家であるジョン・ウォルシュは、3-0カウントのストライクゾーンは0-2カウントよりも50%広いことを発見し、「これらの審判は甘い」と述べています。ウォルシュはさらに、各カウントの得点値、つまり特定のボールストライクカウントの打者への期待値は、3-0(彼の調査では、打者への+.22得点)と0-2(打者への-.11得点)で両極端に達すると指摘しており、これらのカウントでストライクゾーンのサイズをさらに変更することで、審判はこれらの打席の期待値を平坦化し、両方の得点値をゼロに引き戻している。ウォルシュが参照しているデイブ・アレンの以前の記事では、カウント内のストライクの追加は、ストライクゾーンの中心からの距離が1インチ増えるのと同じくらい、審判が投球をストライクと判定する確率に影響することがわかった。アレンは、ボールストライクカウントと投球のブレークの量を制御すると、投球間のストライクゾーンのサイズの変化は重要でなくなることを発見した。

これには「審判はバカだ」という説明以外にも別の説明がある(ちなみに、私はそう言っているのではない。MLB の環境でボールとストライクを十分に正確にコールする仕事は、人間の能力を超えていると思っているのだ)。イータン・グリーンとデビッド・ダニエルズは 2018 年の論文で、審判は統計的識別を用いてカウントや打者の利き手などの認められない情報からボールとストライクの判断を改善し、ゆるやかなベイズ更新(うなずいて読み続けてください)を行って、試合を通してより正確で合理的なコールを行っていると主張している。これを行うには、あるイベントに関連する条件に関する事前知識に基づいてそのイベントの確率を計算できるベイズの定理を知ったり使用したりする必要はない。グリーンとダニエルズは、この種の直感的な修正は長年の練習と継続的なフィードバックによって磨かれた経験則だと書いている。スカウトや野球幹部はそれを「感覚」と呼ぶかもしれない。これは、この仕事を機械に任せるべきであるというさらなる議論だと私は考えています。もし審判が、ボール/ストライクの判定において望ましいレベルの正確さを得るために、試合状況などの情報を使用する必要があると感じるのであれば、それ自体がシステムの問題です。

選手につけられたラベルは、それ自体が一種のアンカーとなり得る。そして野球界は、まさにそのラベルを好む。この選手はエースだが、この選手はただの2番手先発投手だ。ジョーイ・バゴドナッツ?彼は失敗作だ。トゥワーピー・マクスラパーソンは、努力家、ゲーマー、プロのバッター(当たり前だろ)、あるいは、私の一番のお気に入り、野球選手だ。(一体何が彼を区別しているのだろうか?)

アンカリング・バイアスは、野球界の内外を問わず広く蔓延しています。なぜなら、それは私たちの脳にとって非常に基本的な近道だからです。野球界だけでも、その影響がどれほど広範囲に及ぶかは明らかです。審判がボールとストライクのコールにおいてアンカリング・バイアスの影響を受けている場合、打者と投手は、試合ごとに、さらには試合内やイニング内でも、意識的あるいは無意識的に、変化するストライクゾーンに適応しようと努めなければなりません。審判が特に4番ボールや3番ストライクのコールを嫌う場合、打者と投手がそれらのカウントで投球にアプローチする方法はほぼ確実に変わります。監督が選手について最初に知ったこと、例えば春季トレーニングでの選手の最初のライブ映像やメジャーリーグでの最初の数試合などに基づいてアンカリング・バイアスを抱く場合、それは監督がその選手をどのくらいの頻度で起用するか(あるいは起用しないか)、あるいはラインナップやフィールドにどのように配置するかに影響を与える可能性があります。ゼネラルマネージャーが選手のドラフト順位や契約金を基準にする場合、それは他の幹部がトレードで利用する際の大きな非効率性につながる可能性があり、また同じ状況でゼネラルマネージャー自身が避けるべき罠となる。

アンカリングバイアスを克服するにはどうすればよいでしょうか?多くの認知バイアスと同様に、アンカリングはヒューリスティックです。つまり、頭の中で、あるいは短時間では実行できない複雑な評価プロセスを、迅速なものに置き換えるために脳が使う近道です。これは直感的な反応であり、多くの場合、有用でも正確でもありません。意思決定のための通常のプロセスに取り組む時間を確保できるのであれば、常にそうしたいものです。意思決定に考慮すべき実際の変数をリストアップし、それらの変数のみに基づいて評価や計算を行うことで、アンカリングバイアスの影響を受けない証拠を得ることができます。例えば、メジャーリーグのゼネラルマネージャーは、トレード期限直前に、元ドラフト1巡目指名選手2名を含む魅力的なトレードオファーを受け取るかもしれません。彼らは迅速に対応しなければならないという時間的プレッシャーを感じ、無意識のうちに、この2選手が元ドラフト1巡目指名選手だから(あるいは単に馴染みのある名前だから、これも利用可能性バイアスを引き起こす可能性があるから)良いオファーだと判断するかもしれません。それは公平なオファーかもしれないが、GM は適切な評価 (チームのアナリストやスカウトと関係する選手について話し合い、重要なデータを収集し、それに基づいて決定を下す) を行わなければ、それを知ることはできない。

最適な解決策は、意思決定プロセスから人間を完全に排除することだ。MLBチームにStatcastデータを提供している既存のレーダーおよび光学システムは、人間の審判と同程度の、あるいはおそらくそれよりも低いエラー率でボールとストライクの判定を自動化することをリーグに可能にしている。昨年はアリゾナ・フォールリーグでこのシステムを実験し、打者がストライク判定に抗議しようとしたものの、結局は議論する相手がいないことに気づくという、笑える場面も生まれた。この「Automated Ball-Strike(自動ボールストライク)」という巧妙な名前のシステムは、ダイヤモンドバックスとロッキーズの春季キャンプ地であるソルトリバー・フィールドで行われるAFLの全試合で導入された。このスタジアムにはStatcastの計測機器が完備されているからだ。カメラが投球軌道を追跡し、ソフトウェアプログラムがルールで定められた公式ストライクゾーンをボールが通過したかどうかを判定する。そして、ホームプレートの審判は投球がボールかストライクかを示す音声信号を受け取り、それに基づいて判定を宣告する。これは従来とは異なるもので、多くの選手が原則として気に入らなかったが、人間の審判では到底かなわない一貫性と、アンカリングによる偏りがなかった。

もしメジャーリーグベースボールがボールとストライクの判定を自動化し、ゾーンの端での精度を上げる既存技術への投資をさらに進めたとしたら、たとえ不正確なボール/ストライクの判定頻度がすぐに改善されなくても、少なくともストライクの判定ミスはより予測しやすくなるだろう。なぜなら、それらはすべてストライクゾーンの端、つまり判定が曖昧なところで起こるからだ。機械はアンカリング・バイアスの影響を受けないが、人間は受ける。コンピューターはゾーンから1インチ外側の投球をストライクと誤認するかもしれないが、真ん中を狙った投球を見逃すことはない。なぜなら、以前の投球から予測を立てているからだ。人間にはバイアスを回避する時間がないため、バイアスなしに判断するのが難しい判断もある。自分がどのような種類の判断に直面しているかを認識することが、この罠を避ける方法を見つける第一歩である。



WIREDのその他の素晴らしい記事

  • 44歳でマラソンのベスト記録を出すには、過去の記録を超えなければならなかった
  • アマゾンの従業員がパンデミックにおける日々のリスクを語る
  • スティーブン・ウルフラムが物理学の謎を解き明かす
  • 巧妙な暗号化技術が接触追跡アプリのプライバシーを保護できる
  • プロのように在宅勤務するために必要なものすべて
  • 👁 AIがCOVID-19の潜在的な治療法を発見。さらに、最新のAIニュースもお届けします
  • 🏃🏽‍♀️ 健康になるための最高のツールをお探しですか?ギアチームが選んだ最高のフィットネストラッカー、ランニングギア(シューズとソックスを含む)、最高のヘッドフォンをご覧ください