死亡者数から推定する感染者総数

ちょっと思いつきでグラフを描いてたら怖い話になってしまったので共有します。

どこかしらおかしいところがあるはずなのでチェックしてください。データは https://docs.google.com/spreadsheets/d/1hR6IptMeCT0MSVG9crQQ3qztnfGcLk2WFPof_mbu7ac/edit?usp=sharing のシート1の右の方にあります。グラフは3枚目のもの。(左の方&1枚め2枚めのグラフはいつもの致命率推移にまつわるもの。)

経緯

次のようなことを考えた:

  • 日本のクラスター対策戦術は検査を絞るので全体像が見えなくなる。
  • それでは逃げようのないデータから全体を推定してみたらどうだろうか。
  • 逃げようのないデータは死亡者数だ。特異的な病態によりCOVID-19と診断された方が亡くなれば、これは必ずカウントアップされる。

死亡者数から感染者数を推定するために必要なデータは、感染者数と死亡者数の数字である。これは日本の医療環境に即したものである必要がある。

またこのデータは、適度に古い必要がある。死亡までの期間はまちまちなので、「結果を最後まで追ったデータ」が必要である。

この条件に適合したデータは存在している。ダイヤモンド・プリンセスだ。712人が感染して11人死亡。致命率は1.54%となる。高齢者中心なので社会全体にフィットすると死亡率はもっと低くなると思われるが、高くなることも考えられるので、仮に1%〜2%と考えて推定を試みるものとする。

方法

感染から死亡までの時間を平均3週間とみなし、一律に適用した。

COVID-19による死亡率を1.0%、1.5%、2.0%と仮定して、報告されている死亡者数にこの死亡率の逆数を乗じ、死亡率ごとの推定感染者数を得た。

これを報告日の3週間前の日付に割り当て、片対数の折れ線グラフとしてプロットした。

グラフのX軸の原点は、日本で死者が初めて出たのが2/14の3週間前である1/24である。Y軸の原点は100人(死亡率1%での1人目の死亡者)とした。

結果

以下のグラフが得られた。

f:id:kamosawa:20200405131750p:plain

死亡者数のみから推定した感染者数の推移(詳細は本文参照)

曲線は死亡者数から推定した感染者数である。死亡率1%として推定した値(死亡者数*100)を青の、死亡率1.5%として推定した値(死亡者数*(100*2/3))を緑の、死亡率1%として推定した値(死亡者数*50)を赤の実線で示している。

点線は7日間で2倍および3日間で2倍になる値を示したものだ。7日間で2倍になる直線については、推定感染者数の最小値に合わせたもの(赤)、最多値に合わせたもの(青)、両者の中間に合わせたもの(緑)を置いている。

 グラフの値からは次のことが判明した:

  • 本日4月5日の最小値、中間値、最多値(直線上の値)はそれぞれ26880.74895、65536、159778.5577 である。
  • すなわち、死亡者数から推定した現在の感染者数は、およそ2万7千人(最少)から16万人(最多)、中間的なシナリオで6万6千人ほどになる。
  • 一ヶ月後、5月5日の最小値、中間値、最多値(直線上の値)はそれぞれ524288、1278228.461、3116355.895である。
  • すなわち、死亡者数から推定した5月5日の感染者数は、およそ52万4千人(最少)から312万人(最多)、中間的なシナリオで128万人ほどになる。

考察

4月5日の推定感染者数である2万7千人から16万人という値は、既存のどの値よりも多いようだ。

7日に2倍という割合そのものが高すぎる可能性もあるが、この値は日本以外で得られている数字よりはかなり小さい。

  • 死亡者数、ひいては推定感染者数は、初めから7日で2倍の指数関数の線におおむねフィットしている
  • ただし諸外国で得られている3日で2倍という線にはフィットしていない

と考えることがそれほど過激であるとは思えない。

他の見落としはないだろうか。

  • 病原体の再生算数は時間とともに変化し、感染者数が十分に増えれば増加は鈍る。しかし数万人から百数十万人では日本の人口のせいぜい1%程度であり、指数関数的増加が成立しなくなる段階ではない。
  • イタリア等では人口のそれほど高くない割合への感染で増加が鈍る現象が観察されているが、感染初期の日本にこれが適用されるようには思えない。
  • 日本の医療レベルを考えると、ウィルス固有の死亡率を高く誤認する(不顕性感染が多い)ことはあっても、低く誤認する(他の疾患による死を混入する)ことはないだろう。しかし、実際の死亡率がより低かった場合、推定感染者数はさらに多いということになる。

つまり、見落としがあるとしても、推定感染者数は得られた結果より大きくなる要素ばかりに見える。小さくなる要素がない。

だからいまのところ、死亡者数から推定した感染者数はこのような値になる、としか言えないようである。

わけのわからない値が出て困惑気味であるが、それほど大きく外しているとも思えない。日本の感染者数は既に数万のオーダに乗っているのではないか。

みなさん、どう思われますか?