【コラム】コロナ禍に思う統計①
久しぶりにブログを再開しようと思う。
一時期、noteに書いていたが、noteはデザインが単調だし自分の思うような記事が書きずらいので、
結局自分のブログで情報発信するように原点回帰した。
今回は、コロナ禍で感じた統計の重要さについてお伝えする。
統計は何を目的とするのか?
意外と知られていないことだが、統計の目的は、
現象を数量で把握すること
である。その統計の性質を調べる学問を統計学と定義している(Wikipedia)
まあ、ここまではよいのだが、統計にはまず最初に、「現象を調査」する必要がある。
つまり、データ収集が必要だ。
そのデータ収集に関しても、ある程度目的や収集設計が必要で、
○○○○という現象に関して、
△△△△という仮説を裏付けるために、
□□□□のデータを収集したい
といった動機付けも必要になる。
例えば、新型コロナウィルス(covid19)の危険度を調査したい場合は、
・新規感染者数
・新規死亡者数
・重症化率
等の指標が必要になるため、
・新規感染者または日別累計感染者数
・新規死亡者または日別累計死亡者数
・新規重症者数
等の情報を収集する必要がある。
コロナは恐れずに足らず?
ところで、2021年3月下旬以降になって、新型コロナウィルスの変異株が猛威を振るい大阪を中心に感染者が急増している。いわゆる感染拡大の第3波だ。
ただし、一部のデータを見る限りでは、以下のように大阪の新規感染者数は頭打ちになり、ピークアウトしているように見えるのだ。
では、果たしてこれから第3波は収束する方向にいくのだろうか?
移動平均(線)という考え方
値が増えているのか?減っているのか?といった傾向を分析する際には、移動平均(線)という考え方が1つの指標になる。株式投資やFXをやってる方なら一度は耳にしたことがあるはずだ。
移動平均線とは、ある一定の期間の値から平均値を計算してグラフ化したものだ。
○日移動平均線とは、文字通り「○日間の値の平均値をプロットした線」という意味になる。
このように、その日を含めた過去何日間かの値から平均値を算出することで、値の上下を平易化して傾向をつかみやすくなる。
例えば、移動平均線より上に値が存在する場合は上昇傾向、移動平均線よりも値が下にある場合は下降傾向と読み解くことができる。
移動平均線からコロナウィルスの感染拡大状況を読み解く
まず大阪の例から見てみよう。2021/40/21までのデータまで収集されているグラフを見る限りでは、確かに日別陽性者数は4/19を境にピークアウトしているように見える。
だが、ピークアウトか否かを判断する際は、値が移動平均線より下回っている回数がどのくらいあるか?で判断した方が精度が高くなる。移動平均線が頭打ちになったとしても、上のグラフのようにまたさらに値が上がるケースもあるからだ。
上記を見る限り、ピークアウトは当分先になる可能性が高い。
たまに、以下の永江一石氏の記事のように、ピークアウトの相関性を謎な相関関係(平均の増加率?)で判断してしまうケースもあるが、原理原則で言えば移動平均線が大きな指標になる。
現時点では、少なくとも2つの感染者数の棒グラフが7日間移動平均線よりも上にいってるので、まだピークアウト寸前!と判断するのは時期尚早というのが私の意見だ。
大きな波はエリオット波動を描く?かもしれない
ところで、株やFXの相場を見てると、値が大きく動くときは1つの共通波形を描くことがある。
それを、エリオット波動と呼ぶ。
エリオット波動は、あくまで市場における相場の動きの経験則であり、数理統計や経済学的に裏付けされた原則ではない。しかしながら、過去のデータを見てみると半分程度の確率で再現することがある。
エリオット波動は、上昇5波 / 下降3波といわれている。
エリオット波動の本質は、
上昇はじわじわとあがり、下降はすぐに下がる
という点にある。特に、
・上昇局面は、上昇第1波→下降(調整)→上昇第2波→下降(調整)→上昇第3波
・下降局面は、下降第1波→上降(戻し)→下降第2波
という傾向になりやすい。さらに、上昇の場合は、第1波< 第2波 < 第3波と波の大きさは回数を経るごとに大きくなっていく(下降の場合は逆)
そこで、実際にコロナ新規感染者数の推移をエリオット波動に当てはめてみた。
確かに、ある程度再現性があるのではないか?と思ってしまう。
・実際に、2020年07月ごろが第1波のピーク(①)でその後下がる。
・底に来たかと思いきや、2021年1月に第2波のピーク(②)がくる。
・さらに下降して底に来たと思いきや、2021年4月から急に増え始める(④ – ⑤)
さらに言えば、
・第3波のピークアウトは、かなり先。
・第3波のピーク感染者数は、第2波の感染者数のピークよりもさらに大きくなる可能性がある。
という予想もできるわけだ。
なぜ、エリオット波動が当てはまるのか?論理的説明が成り立つとは思えないが、1つ群集心理が共通している可能性がある。
・市場心理の場合:第1波は懐疑的な買い手も、第2波、第3波を経るにつれ買ってしまう
・コロナの場合:第1波は大人しく家にいた人たちも、第2波、第3波を経るにつれ人的接触を増やしてしまう。
数値は大事だが、数値が示す本質を読まないと意味がない
ここまで統計、特に数値だけでなく、数値の動きを読む重要性について簡単に説明した。
単純な数値の動きだけ追っていても、その数値が意味するところや関係する要素が理解できていないと、判断を見誤ってしまう。
今回は、あくまで感染者数のみ言及したが、本来であれば「医療崩壊しているのかどうか?」「これ以上感染拡大したら医療崩壊するのか否か?」を、数値から判断するのがコロナ禍の統計の目的になると思う。
次回以降は、重症者数、回復者数、空き病床数や医師の稼働率等、重症化した患者を受け入れられるのか?等といった視点から、順をおって分析していこうと思う。