測定、ランク付け、評価という非合理的な数学が、物、仕事、人などあらゆるものの価値を歪める仕組み。
ビデオ: ジャッキー・ヴァンリュー、ゲッティイメージズ
3月14日1時59分(3.14159)には、世界中の人々がパイを食べ、ぐるぐる回り、コンピューターをクラッシュさせ、そしてとにかく非合理的な行動に出る。これらはすべて、誰もが大好きな無理数を祝うためだ。円周率の日(パイデー)は1988年にサンフランシスコのエクスプロラトリアムで生まれたが、その後世界中に広がり、ユネスコと米国下院の両方で認められている。方程式によく使われる円周率は、詩や物語を書くのに楽しい制約言語「ピリッシュ」(「お酒が飲みたい。もちろんアルコール入りで」というフレーズは最初の9桁を使う)を生み出した。ちなみに、3.14はアインシュタインの誕生日でもある。パイという名前の猫を飼っているのは私だけではない。
しかし、私たちは円周率を完全に誤解しています。円周率は実際には数値ではありません。円の直径と円周率の関係性です。円周率の豊かさは、不適切な数値(シンデレラの靴を思い浮かべてください)に押し込められた時に初めて無理数となり、美しさを砕き、その意味を覆い隠してしまうのです。数値は円周率の本来の言語ではありません。翻訳によってその本質が失われても驚くべきことではありません。
最近、成績評価の恐ろしさ、つまり学生を数字に当てはめることに直面した時、私はこのことに強く衝撃を受けました。私が優等生プログラムで教えているワシントン大学の同僚講師たちも、同じような恐怖を感じています。円周率よりもさらに非合理的なことですが、人を評価するということは、未知の、通常は知りえないもの同士の関係を定量化することに等しいのです。数学者ポール・ロックハートは著書『測定』の中で、あらゆる測定は比較であると指摘しています。「私たちは、測定しているものと、それを測る基準となるものを比較しているのです。」
学部生を評価するのに何を基準にすればいいのだろうか?どのような側面を比較できるのだろうか?質か量か?独創性か努力か?参加か進歩か?せいぜいリンゴとオレンジを比べるくらいだ。むしろバナナと象に近い。定量テストでさえ、せいぜい試験作成者が学生に知っておくべき知識と指導の有効性を比較するに過ぎない。成績は、こうした通過点の永久的な記録となる。
採点者をどう評価するのでしょうか?物理学者の友人が、高校時代は数学のスターだったハーバード大学1年生が物理でFを取ったことを知った時、「ハーバードは恥を知るべきだ」と言いました。ハーバード大学出身の彼自身も、学生が学校を落第させるよりも、学校が学生を落第させる方がはるかに多いと考えていました。STEM(理系・理系)の教授の中には、授業の冒頭で「生徒の半分は落第するだろう」と告げる人もいるそうです。私はその先生にFをつけます。
ランキング、格付け、そして成績評価という不合理な行為に不快感を抱いているのは、私だけではありません。イェール大学とハーバード大学のロースクールの学長たちは最近、USニューズ&ワールド・レポートのランキングから自らを除外しました。これに続き、ハーバード大学医学部をはじめとする多くの大学も除外しました。「ランキングは教育の卓越性を意味のある形で反映することはできない」とハーバード大学のジョージ・O・デイリー学長は述べています。ランキングは、大学がデータを改ざんし、「より崇高な目標」ではなくランキングを上げるための方針を策定することにつながるのです。
教育を蝕んできたものが、今や他のすべてを呑み込んでいる。最近、主治医から「数値が良く見えるから」という理由で高額な診断検査を受けるよう勧められた。看護師は、絵文字のトーテムポールで痛みの度合いをランク付けするように言った。そして診察後、自分の経験を評価するように言われた。数字はすべて無理数だ。まるで円周率の終わりのない数字のように、終わりがないように見える。
私たちは、レストランでの食事、配管工の訪問、飛行機に乗るたびにつきまとう、ポイントや星、いいね、親指を立てる(または中指を立てる)よう懇願する、うっとうしい大量の要求を、たとえそれが私たちの正気を少しずつ蝕んでいるとしても、できるだけ無視しようとします。
しかし、真の代償は苛立ち以上のものだ。測定を誤解することは、理解そのものを誤解することだ。遍在的で絶え間ない調査は知識をノイズで覆い隠し、物事がどのように機能するのか、何が起こっているのか、私たちが何をしているのか、何が本当に重要なのかを理解する上で本当に必要な情報をかき消してしまう。
まず第一に、「何と何を比較したか」を考慮しない測定方法には疑念を抱くべきです。人口におけるウイルスの蔓延率と比較せずにCOVID-19による死者数を数えても、その致死率、回復した人や「ロング・コビッド」を患う人の数、さらにはどの変異株が「流行」しているのかさえ、全く分かりません。誰も数えていないので、これらの数字を知ることはできません。分母がまたしても消えてしまったのです。
もっと単純な例を挙げましょう。誰かが(例えば米国国立標準技術研究所(NIST)が「フィート」という単位を記録している限り)、巻き尺の目盛りと絨毯の長さを比べることで測ることができます。ある種類のフィートは、2023年1月1日の真夜中を以て廃止されました。標準的な「国際フィート」は0.3048メートルですが、実際には光の波長で測定されます。どのような言い回しであれ、「フィート」は直径と円周、あるいは空間と時間といった既知の関係性を指します。あらゆることを考慮すると、「フィート」は確固たるものです。
対照的に、ほとんどの測定は「不可能」だとロックハートは書いている。「測定できる可能性があるのは、ごく単純な物体だけだ」
私たちが測るものはどれも単純ではありません。なぜなら、あらゆるものが互いにつながっており、どんな測定基準にも無数の要素、つまり無数の考慮要素が含まれているからです。例えば、物理学者が「運動」の複雑さを理解する前にどれほど苦労したかを考えてみてください。運動は一つの物体というよりは、速度、加速度、運動量、力といった、動く要素の集合体でした。
私も他の人たちと同じように、常に自分の状態、自分がどの程度なのかを評価しています。若い頃の自分と比べて? 同年代の人たちと比べて? 社会的な期待と比べて? 実年齢で? 生物学的年齢で? 最近のダンス教室で、他の生徒と比べて自分を測り、最下位につけてしまいました。先生に、自分の実力を超えているかどうか尋ねたところ、「あら、前回より上手くなりましたね」と先生は言いました。確かに、ハードルは低いですね。平均回帰分析でわかるのは、最初の週にクラスで最悪だったとしたら、進むべき道はただ一つ、上に向かうことだということです! 先生が見た改善は、単純な確率でした。
でも、疑問に思うことがあります。もしある生徒が学期初めはトップの成績だったのに、中間試験で凡庸な課題を提出してきたら、私はその生徒の点数を下げてしまうのでしょうか?それとも、後にAプラスの課題を提出してきた凡庸な生徒に、過剰な評価を与えてしまうのでしょうか?おそらく、そうでしょう。
加齢とともに、評価への衝動、いや、もしかしたら評価の必要性が増すかもしれません。ウエストサイズを気にする人もいれば、歩数を数える人もいれば、ポートフォリオにばかり気を取られている人もいます。多くの人が自分を他人と比較します。しかし、富と同じように「健康」という感覚も相対的で個人的なものだと分かっているので、これは無意味だと思います。裕福な人と付き合っている友人たちは、私よりもずっと貧乏だと感じています。
対照的に、科学技術は測定の正確さに執着する。NISTは、太陽光を含むあらゆる物に精度を要求している。ロケットの推力やアルコール濃度、煙探知機や地震発生確率、食べ物の辛さやピーナッツバターの価格などだ。ファゾム、ハロン、リーグ、エーカー、そしてもちろんフィートといった単位にも基準を設けている。
あらゆる測定には、弾性変形、機器の形状、再現性における不確実性を考慮した「不確実性予算」が付随します。著者は時に独創的な表現を用いることがあります。NISTの情報源によると、おそらくこれまでに書かれた中で最も優れた不確実性に関する記述は、アンモニアの熱容量の測定結果について報告したCH Meyers博士によるものです。「我々は報告された値が10,000分の1まで正確だと考えています。10,000分の2まで正確であれば、自己資金を賭けても構いません。さらに、万が一、我々の値が1,000分の1を超える誤差を示した場合、我々は装置を食べてアンモニアを飲む覚悟です。」
NISTが直面する最大の問題は、私が採点に直面するのと同じように、ノイズです。つまり、視界を曇らせ、判断を混乱させる、無関係な要素が山のように積み重なるのです。生徒の授業での成績を、睡眠や食事など、彼らの生活の中で起こっている他のあらゆることと切り離して考えることはできません。空腹の裁判官は、胃袋と重大な判断を切り離すことができず、昼食をとったばかりの裁判官よりも仮釈放を認める可能性が低くなります。一体どうやって(私の好きな数学用語を使って言うと)デコンボリューション(畳み込み)できるというのでしょうか?
測定は時として理解の代わりになるものでなければならないが、測定者はこうしたごまかしを事前に認めなければならない。比類なきリチャード・ファインマンがそうしたように。物理学者は「エネルギーを様々な方法で、様々な名前で測定していることを、心から恥じるべきだ」と、彼はよく知られた愚痴をこぼした。彼らは量の計算規則を持っているので、エネルギーが保存されることを知っている。しかしながら、「今日の物理学において、我々はエネルギーとは何かという知識を持っていない。エネルギーが一定量の小さな塊として存在するというイメージを持っていない…我々の知る限り、実在する単位も、小さなボールベアリングも存在しない。計算するたびに変化しない数値が存在するというのは抽象的で、純粋に数学的なことだ。私にはこれ以上うまく解釈することはできない。」
50年経った今でも、ほとんど何も変わっていません。ある現代物理学者によると、エネルギーは根本的に関係性で成り立っているからです。まさに円周率と同じです!「関係性は、手に持った瞬間に、複数の構成要素から成り立っていることに気づくはずです。」
実際、原子レベルでの精密な測定という行為自体が、測定対象を破壊する可能性があるのです。これはハイゼンベルクの悪名高い不確定性原理に明記されています。これは、いわゆる現実世界でも常に起こり得ます。例えば、ダンスのインストラクターがターンを細かく分解して説明するとします。その途中で、インストラクターが全員が右足(または左足)で立っているか確認できるように、あなたは「フリーズ」します。問題は、フリーズすることで動きが止まってしまうことです。一度止まってしまうと、それはもはやターンではなくなります。
ほとんどの測定は、ある意味では破壊的であると私は断言します。ただし、間違っていたとしても、コンピューターを食べるつもりはありません。
ウォール・ストリート・ジャーナルの最近のコラムによると、大手出版社は「目に見える成功」に集中しすぎて、似たり寄ったりの作品に多額の資金を注ぎ込み、Aリストより下だがバックリストより上に位置するミドルリストを破壊している。ミドルクラスと同様に、ミドルリストもかつては大多数を占め、多くの作家が作家生活の大半をそこで過ごしていた。
企業は時折、指標が自社にとって必要な情報を明らかにしておらず、ひいては誤った方向に導いていたことに気づくことがある。マテル社のCEOは、業績不振の原因を創造性の停滞に求め、「数字への執着」が原因だと説明した。「会社はスプレッドシートとチェックリストに支配されていました。『私たちは良いおもちゃを作っているのだろうか?』と、真摯に自問自答していませんでした」
もちろん、私たちが測定するもののほとんどは代理指標であり、私たちが知りたい、とらえどころのない事実の具体的な代替物です。分析ソフトウェアは、投稿を何人がシェアしたかは教えてくれますが、あなたが影響を与えたか、信頼を得たか、誰かの考えを変えたかまでは教えてくれません。
同僚が、公衆衛生アウトリーチの成功を評価することの危険性について説明してくれた。特に彼女が働くような、しばしば辺鄙な村々ではなおさらだ。配布したチラシの枚数は数えられるが、それらは読まれているだろうか?トイレットペーパー(これも役に立つ)として使われているだろうか?配布したマラリア予防ネットは実際に病気を抑制しただろうか?同僚が知っているある事例では、そのネットが(また)ウェディングベールとして使われていた。「それは美しいものだった。理にかなっている」と彼女は言った。寄付者は数字を欲しがっていたので、何かを測る必要があった。誰もがその数字が本当に何を意味するのかは誰も知らなかったのだ。
企業は、リモートワーカーがコンピューターのマウスをいじっている時間を生産性の指標として使うようになりました。これは、長く働けば働くほど一生懸命働き、結果が良くなるということを暗示しています。一方、時間制限のあるテストでは、知性の指標であるスピードが評価されます。どちらも理にかなっていませんが、時間は簡単に測定できるため、便利な代替指標となります。当初はAIアートを嘲笑していた批評家も、制作者が膨大な時間を費やしたことを知って考えが変わりました。私は学生を課題に費やした時間で評価しているでしょうか?おそらくそうでしょう。
では、「無駄な」時間はどうでしょう? 一体全体、何点くらいになるのでしょう? 物理学者の友人が、山頂の絶景ハイキングについて話してくれました。道中、隠れた洞窟や小川、妖精のスリッパに偶然出会ったそうです。彼は友人たちを無理やり連れて行きましたが、決まった時間に景色を見なければならず、ゆっくりする暇もありませんでした。友人たちは機嫌が悪くなり、一人でそんな旅に出るのは気が進まないだろうと彼は考えました。物理教師である彼も、どんなに息切れしても、道から外れることでしか得られない発見の喜びを味わえなくても、教材を最後までやり遂げなければならないというプレッシャーを感じていました。
授業中に脱線する時間は「無駄」だと心配するかもしれません。しかし、その「無駄な時間」こそが最も生産的になり得ることを私たちは知っています。
時間を尺度とする最も愚かなのは年齢だ。中には、可能な限りの時間を(あるいはそれ以上に)捻り出して100歳以上まで生きようとする人もいる。私や私の知る「高齢者」のほとんどがそうではない。マーガレット・ドラブルの新作小説『The Dark Flood Rises』の中で、老年のフランはこう語る。「長寿は私たちの年金、ワークライフバランス、医療サービス、住宅、そして幸福をめちゃくちゃにしてきた。老いそのものをめちゃくちゃにしている。」
生きた年数というのは、人生を測る上で馬鹿げた尺度に思える。生きている年数と生きていない年数、生きている年数と生きていない年数を比較する。一体、そんなの何なの? 生から死までの年数は数えられるが、その前後の年数は無限に伸びていく。まるで円周率みたいだ。
友人が、私が正式に年老いた今、一体どんな「知恵」を得たのかと、しつこく尋ねてくる。何を基準に判断すればいいのか、わからない。自分を他人と、たとえ過去の自分とさえも比べないようにしてきた。つまり、測ることをやめる、ということだ。鏡に映る自分の姿は、特に気に入らない。でも、一体何を見ればいいんだろう?もっと若い人?もっと身近な人で我慢するしかない。
古くからの友人である円周率に、私は確かに慰めを見出している。知恵とまではいかないまでも。念のため言っておくと、円周率は実数であり、現実に存在する。そして、私にとっても、そして他の世界にとっても、それは超越的なものだ。
円周率は教えてくれる。「数じゃない、バカ。大切なのは人間関係だ。人間関係がしばしば非合理的に思えても、それはそれでいい。合理性は過大評価されている。」
ぜひ、この記事を読んでどうだったか評価してください。1からπまでで。楽しんでくださいね。

KC コールは WIRED の上級特派員であり、最近では『Something Incredibly Wonderful Happens: Frank Oppenheimer and the World He Made Up』の著者です。...続きを読む