片対数プロットとは何か?そしてそれを Covid データにどのように活用できるか?

片対数プロットとは何か?そしてそれを Covid データにどのように活用できるか?

この新型コロナウイルス感染症(COVID-19)のパンデミックは、事態が好転していないことは明らかです。つまり、状況は深刻で、悪化の一途を辿っているように見えます。感染者数はとてつもなく増えています。本日時点で、米国だけで1,000万人以上のCOVID-19感染者が確認されています。しかし、他の国(韓国など)では、感染者数は3万人以下と、はるかに少ないです。あるいは、米国の感染者数が数百人だった3月と、数百万人だった10月の感染者数を比較したい場合もあるでしょう。では、このように非常に大きな値の範囲を持つデータをどのように表示すればよいのでしょうか?答えは、片対数プロットを使うことです。その仕組みを詳しく説明します。

まずは、確認された症例数を日数別に表したシンプルなグラフから始めましょう。この例では、1日目は米国(および韓国)で最初の新型コロナウイルス陽性症例が確認された最初の日です。韓国の人口は米国よりも少ない(5100万人対3億2800万人)ため、人口の多い国も含めると良いかもしれません。ここではブラジル(2億900万人)とインド(14億人)を例に挙げます。これは、これら4か国を対象とした正規分布(片対数分布ではない)のグラフです。ちなみに、このデータはすべてジョンズ・ホプキンス大学のCovid-19データリポジトリから入手できます。

このグラフから何か気づきましたか?アメリカの感染者数が非常に少ないという以外に何かありますか?注目すべきは、韓国のデータが全く見えないことです。データは確かにあるのですが、小さすぎて見えないのです。膨大なアメリカのデータと、それほど大きくない韓国のデータの両方を検証したいなら、片対数グラフが必要です。(この場合の「log」は対数(logarithm)の略で、実際の木の丸太ではありません。)

片対数プロットって一体何?まずは対数の説明から始めましょう。まずは大きな数字から始めましょう。例えば100万はどうでしょう?これは1の後にゼロを6つ並べた最も一般的な書き方で、1,000,000のように書けます。でも、10の累乗で書くこともできます。

1000000 equals 10 to the 6th power

イラスト: レット・アラン

念のため、10 6 は10 x 10 x 10 x 10 x 10 x 10 を意味します。では、10 の累乗の逆数を求めたい場合はどうすればよいでしょうか。大きな数を表すには、累乗する方がはるかに簡単です。これは、科学的記数法で数値を表すときにまさに行うことです。ある数を 10 の何乗にするかを求めるのは、まさに対数です。1,000,000 の対数を取ると、結果は 6 になります。ああ、ここで重要な注意点があります。10 の累乗について話している場合、対数の底は 10 を使用していることを意味します。最も一般的な 2 つの底は 10 (数値を 10 進数で表記するため) または自然数 e (e は約 2.718 です、無理数です) です。e のより詳しい説明は、こちらを参照してください。

log of 10 to the x power equals x. log of 1000000 equals log of 10 raised to the 6 power equals 6

イラスト: レット・アラン

でもちょっと待ってください!10の整数乗以外の数の対数も取れます。とりあえず1234を選びましょう。この数の対数を取ると、次のようになります。

log 1234 equals 3.09132

イラスト: レット・アラン

つまり、10を3.09132乗すると1,234になります。でも、なぜでしょうか?なぜそんなことをするのでしょうか?さて、あのひどいCOVIDデータに戻りましょう。確認された感染者数をプロットする代わりに、感染者数の対数(10を底とする)をプロットするとします。すると、感染者数と日数の関係を対数でプロットできます。結果は次のようになります。

念のため確認しておきますが、これは最初のグラフと同じデータですが、大きな違いがあります。韓国の感染者数は米国よりもはるかに少ないにもかかわらず、韓国のデータが表示されています。なぜでしょうか? では、2020年11月17日時点の確認感染者数を見てみましょう。米国は11,036,935人、韓国は28,769人です。では、これら2つの数値の対数(底10)を取ってみましょう。

log of 11036935 equals 7.04285 and lof of 28769 equals 4.45892

イラスト: レット・アラン

対数関数の非常に大まかな概算が必要な場合を除き、電卓に入力するか(または対数表を使って値を調べる)、数値を入力すれば済みます。これで、大きく離れた数値ではなく、同じ範囲(7.04と4.46)に値が存在するため、グラフ上で同じスケールに簡単に収まります。ただし、データの対数を取る必要はありません。別の方法として、非線形の縦軸を使用する方法があります。その例を以下に示します。

縦軸の数字は固定の刻み幅ではないことに注意してください。縦軸の目盛りは、例えば1,000件の増加といった加法的な増加ではなく、10の累乗で増加していることを示しています。横軸の目盛りは依然として直線であるため、これは片対数プロットと呼ばれます。両対数プロットでは、両軸とも指数スケールになります。

では、片対数プロットと線形軸プロットは、いつ使うべきなのでしょうか?データが非常に広い範囲(桁数が異なる)にわたる場合は、すべてを把握するために片対数プロットを作成する必要があります。データの範囲が同じ大きさであれば(たとえ非常に大きな数値であっても)、通常のプロットを作成すれば十分です。ただし、注意が必要です。片対数プロットを見て線形軸を持っていると仮定すると、実際にはそうではないのに、韓国の状況がかなり悪いように見えてしまいます。

残念なことに、新型コロナウイルス感染症の確定症例については、片対数プロットがほぼ必要になります。


WIREDのその他の素晴らしい記事

  • 📩 テクノロジー、科学、その他の最新情報を知りたいですか?ニュースレターにご登録ください!
  • 死、愛、そして100万個のバイクの部品の慰め
  • 国を救いたかった詐欺師
  • ファークライ5は現実逃避に役立ったが、それがうまくいかなくなった
  • コロナニュースレターの執筆を通してアメリカについて学んだこと
  • 命を救うには、このパンデミックを直視する必要がある
  • 🎮 WIRED Games: 最新のヒントやレビューなどを入手
  • ✨ ロボット掃除機からお手頃価格のマットレス、スマートスピーカーまで、Gearチームのおすすめ商品であなたの家庭生活を最適化しましょう