April 02, 2020
「感染者数グラフの正しい書き方、読み方」の最初の記事(2020年3月31日、「感染者数グラフ」の正しい書き方、読み方。(1)ウイルス感染数の増加はなぜ時間をX軸にした片対数グラフがフィットするのか。 | Damejima's HARDBALL)では、自然現象に指数関数的な増加や減少が多くみられることから、ウイルス感染の把握に対数グラフが適している理由を説いた。
2回目のこの記事では、グラフを具体的に書くべきかについて論じてみたい。(以下、常にX軸は「日付」、Y軸は「感染者数」)
----------------------------------------------------
出発点として、まず、目盛りが等間隔にできた、リニアなグラフを見てみる。赤と緑の2つのデータをプロットしてある。
図1
赤い線
赤い直線が表しているのは、「毎日、同じ数だけの感染者が増加していく」という状態であり、この例では「1日ごとに2万人ずつ」、「2万、4万、6万、8万、10万」と増えて、5日間で感染者数10万人に到達する。
緑の線
緑色は曲線で、赤い線とは「増加のしかた」がまったく異なる。
赤い線のように1日の増加が「毎日2万人ずつ」と決まっているのではなくて、感染者数が1日ごとに「10人、100人、1000人、10000人、100000人」と、「毎日毎日、その前日の10倍に増えていく」。
また、2つのグラフは見た目も違う。緑の直線は「最初はほぼ横ばい」だが、感染の急激な拡大が起こると「いきなり立って」くる。
----------------------------------------------------
どちらのグラフが「現実に即して」いるか。
これは論ずるまでもないので、次にいく。
----------------------------------------------------
通常のリニアなグラフにおいては、「2万、4万、6万、8万、10万」と「決まった数ずつ増加する事象」は「直線」で表される。
対して、「10人、100人、1000人、10000人、100000人」と「増加のしかたそのものが右上がりに増えていく」という増加は、「指数関数的な増加」であり、緑で示したような曲線であらわされる。
武漢肺炎の感染では、「1人の感染者から、2人〜2.5人に感染する」という拡大がみられるという研究結果が中国にある。つまり、武漢肺炎の感染拡大という事象は、前の記事でも書いたように、1人の感染者が2人に感染させ、その2人の感染者が4人に、4人が8人に、8人が16人に、「1→2→4→8→16→32」というふうに、「増加が、時間経過とともに急激になっていく」という、自然界によくみられる典型的な指数関数的増加なのである。
----------------------------------------------------
問題はここからだ。
----------------------------------------------------
典型的な指数関数的な増加である武漢肺炎の感染者数の爆発的増加(オーバーシュート)を図示する最適な方法を探すため、まず「3日おきに感染者数が決まって10倍になる」というグラフを2種類用意した。
図2
左:リニアなグラフ
Y軸の目盛りはそれぞれ等間隔でできている。ここではオーバーシュートは、「急激に右上がりになる曲線」として表現される。
右:Y軸が対数でできたグラフ
次に、同じデータを「対数グラフ」で書いてみる。Y軸のみを対数にした片対数グラフである。グラフの横線が均等に並んでいないことでわかるように、Y軸の目盛りは等間隔ではない。
すると、「右上がりの曲線」だったグラフが、こんどは「まっすぐな直線」として表現される。
2つのグラフは、データそのものは同じだが、「Y軸の目盛りの並べ方がまったく異なっている」ために、表現されるグラフの形状がまったく異なる。このことから、次のようなことがわかる。
----------------------------------------------------
次に、上の2つグラフに少し変化をつけてみる。
「1日目から7日目までは『3日ごとに10倍』になったが、7日目以降で感染者数の増加がちょっと鈍り、10日目の感染者数は『7日目の10倍の10000人』ではなく、『3倍の3000人』だった」という状態を、太い青線で示してみた。
図3
このことからわかることは、以下である。
----------------------------------------------------
この例によって、「なぜ『見た目の感染者数の増加』にとらわれるべきでないか」がわかる。
数字にとらわれやすい人は「7日目が1000人で、10日目に3000人」と聞くと、「なんと2000人も増えた! 大変だ!」と感じてしまう。増加率の変化にまったく気づかないまま、2000人増加という数字の増加だけにとらわれて、パニックを起こしてしまうのである。その挙げ句に、全員をPCR検査しろだの、都市を封鎖しろだのと無意味に騒ぎたて、買いだめに走るのである。
だが、それはまったくの勘違いだ。
事実は、
----------------------------------------------------
もう少し説明する。
上の例では、最初に、「感染者数が3日おきに10倍になる」と、「『同じ増加率』が10日間ずっと続く」という「想定」でグラフを作成した。「増加率に変化がないこと」は、片対数グラフでは「右上がりのまっすぐな直線」として示される。
その後、変化を加え、「3日おきに10倍という決まった率」ではなく、7日目以降に「3日で『3倍』」としてみる。すると、それまで「まっすぐな直線」だったグラフ形状が変わり、「寝てくる」のである。
この「グラフの形状の変化」が、「もしかすると感染の拡大が落ち着いてきたかもしれない」という近未来の推測につながる。
----------------------------------------------------
もういちど、元の「3日おきに感染者数が10倍になる」という2種類のグラフを眺めてみる。
図4
左のリニアなグラフの最大の欠点は、10日目の感染者数が、「9000人」だろうが、「1万人」だろうが、「1万1000人」だろうが、見た目に「ほとんど違いがわからず、どれもこれも同じ、右上がりの急激な曲線にしか見えない」ことである。
こんな雑なグラフでは「事態の推移」を読み取ることはできない。マスメディアが感染者数の増加だけを記事にする無責任な行為は、事実の報道などではなく、パニックを煽っているのと同じなのである。
だが、右の対数グラフでは、実数の変化にとらわれずに、感染の拡大がいまどういう傾向にあるかを「グラフの形状の変化から直接読み取る」ことができる。
(3につづく)
2回目のこの記事では、グラフを具体的に書くべきかについて論じてみたい。(以下、常にX軸は「日付」、Y軸は「感染者数」)
----------------------------------------------------
出発点として、まず、目盛りが等間隔にできた、リニアなグラフを見てみる。赤と緑の2つのデータをプロットしてある。
図1
赤い線
赤い直線が表しているのは、「毎日、同じ数だけの感染者が増加していく」という状態であり、この例では「1日ごとに2万人ずつ」、「2万、4万、6万、8万、10万」と増えて、5日間で感染者数10万人に到達する。
緑の線
緑色は曲線で、赤い線とは「増加のしかた」がまったく異なる。
赤い線のように1日の増加が「毎日2万人ずつ」と決まっているのではなくて、感染者数が1日ごとに「10人、100人、1000人、10000人、100000人」と、「毎日毎日、その前日の10倍に増えていく」。
また、2つのグラフは見た目も違う。緑の直線は「最初はほぼ横ばい」だが、感染の急激な拡大が起こると「いきなり立って」くる。
----------------------------------------------------
どちらのグラフが「現実に即して」いるか。
これは論ずるまでもないので、次にいく。
----------------------------------------------------
通常のリニアなグラフにおいては、「2万、4万、6万、8万、10万」と「決まった数ずつ増加する事象」は「直線」で表される。
対して、「10人、100人、1000人、10000人、100000人」と「増加のしかたそのものが右上がりに増えていく」という増加は、「指数関数的な増加」であり、緑で示したような曲線であらわされる。
武漢肺炎の感染では、「1人の感染者から、2人〜2.5人に感染する」という拡大がみられるという研究結果が中国にある。つまり、武漢肺炎の感染拡大という事象は、前の記事でも書いたように、1人の感染者が2人に感染させ、その2人の感染者が4人に、4人が8人に、8人が16人に、「1→2→4→8→16→32」というふうに、「増加が、時間経過とともに急激になっていく」という、自然界によくみられる典型的な指数関数的増加なのである。
----------------------------------------------------
問題はここからだ。
----------------------------------------------------
典型的な指数関数的な増加である武漢肺炎の感染者数の爆発的増加(オーバーシュート)を図示する最適な方法を探すため、まず「3日おきに感染者数が決まって10倍になる」というグラフを2種類用意した。
図2
左:リニアなグラフ
Y軸の目盛りはそれぞれ等間隔でできている。ここではオーバーシュートは、「急激に右上がりになる曲線」として表現される。
右:Y軸が対数でできたグラフ
次に、同じデータを「対数グラフ」で書いてみる。Y軸のみを対数にした片対数グラフである。グラフの横線が均等に並んでいないことでわかるように、Y軸の目盛りは等間隔ではない。
すると、「右上がりの曲線」だったグラフが、こんどは「まっすぐな直線」として表現される。
2つのグラフは、データそのものは同じだが、「Y軸の目盛りの並べ方がまったく異なっている」ために、表現されるグラフの形状がまったく異なる。このことから、次のようなことがわかる。
・対数グラフにおける「右上がりの直線」は、「感染の拡大が続いていること」を意味する。
・対数グラフにおける「右上がりの直線」の「傾き」は「増加の激しさ」を意味していて、傾きが「立って」いるほど、増加は激しい。
----------------------------------------------------
次に、上の2つグラフに少し変化をつけてみる。
「1日目から7日目までは『3日ごとに10倍』になったが、7日目以降で感染者数の増加がちょっと鈍り、10日目の感染者数は『7日目の10倍の10000人』ではなく、『3倍の3000人』だった」という状態を、太い青線で示してみた。
図3
このことからわかることは、以下である。
・対数グラフにおける「右上がりの直線」の「角度がX軸に平行に寝てくること」は、「感染の増加がやや鈍ってきたこと」を意味する。
----------------------------------------------------
この例によって、「なぜ『見た目の感染者数の増加』にとらわれるべきでないか」がわかる。
数字にとらわれやすい人は「7日目が1000人で、10日目に3000人」と聞くと、「なんと2000人も増えた! 大変だ!」と感じてしまう。増加率の変化にまったく気づかないまま、2000人増加という数字の増加だけにとらわれて、パニックを起こしてしまうのである。その挙げ句に、全員をPCR検査しろだの、都市を封鎖しろだのと無意味に騒ぎたて、買いだめに走るのである。
だが、それはまったくの勘違いだ。
事実は、
「対数グラフがX軸に平行に寝てきた」ということであり、それは「感染の拡大が落ち着いてきたかもしれない」といえる状態なのだという意味である。
----------------------------------------------------
もう少し説明する。
上の例では、最初に、「感染者数が3日おきに10倍になる」と、「『同じ増加率』が10日間ずっと続く」という「想定」でグラフを作成した。「増加率に変化がないこと」は、片対数グラフでは「右上がりのまっすぐな直線」として示される。
その後、変化を加え、「3日おきに10倍という決まった率」ではなく、7日目以降に「3日で『3倍』」としてみる。すると、それまで「まっすぐな直線」だったグラフ形状が変わり、「寝てくる」のである。
この「グラフの形状の変化」が、「もしかすると感染の拡大が落ち着いてきたかもしれない」という近未来の推測につながる。
----------------------------------------------------
もういちど、元の「3日おきに感染者数が10倍になる」という2種類のグラフを眺めてみる。
図4
左のリニアなグラフの最大の欠点は、10日目の感染者数が、「9000人」だろうが、「1万人」だろうが、「1万1000人」だろうが、見た目に「ほとんど違いがわからず、どれもこれも同じ、右上がりの急激な曲線にしか見えない」ことである。
こんな雑なグラフでは「事態の推移」を読み取ることはできない。マスメディアが感染者数の増加だけを記事にする無責任な行為は、事実の報道などではなく、パニックを煽っているのと同じなのである。
だが、右の対数グラフでは、実数の変化にとらわれずに、感染の拡大がいまどういう傾向にあるかを「グラフの形状の変化から直接読み取る」ことができる。
「1万1000人なら、グラフがやや右上がりに曲がる。右上がりに曲がることは、感染が『より拡大傾向にある』ことを意味する」
「1万人なら、グラフは直線のままで、感染はそれまでと『同じ率』で拡大を続けている」
「9000人なら、グラフは右に寝てくるから、感染は『やや収束に向かいつつある』」
(3につづく)