covid-19自主研究(2020年11月)

2020年12月2日 | By 縄田 直治 | Filed in: データの利活用, 統計.

8月に陽性者のピークが出現したときに自主研究として発表しましたが、その後9月10月は新規陽性者の発生が収まった感がありました。しかし11月に入ったあたりから再度上昇傾向を見せ、12月に入ったいま、また飲食店に夜間営業の終了時刻を22時とすることや、高齢者の移動の自粛を求めるなど、年末に向けての緊張感が出てきています。

この自主研究は、日々陽性者数(を相変わらず感染者として)とGoToキャンペーンしか報道しないマスコミの姿勢に辟易して、世相はともかくも東京都の公表しているデータを見て冷静に考えようという趣旨で素人分析を試みたものです。

データソースは東京都福祉保健局が公表しているオープンデータです。なお死亡者に関する情報は、福祉保健局が報道発表している個人データを手で拾ったものです。

もとより医療関係の知見があるわけでもなく、データの集計ミスや解釈の誤りなどが含まれている可能性がある前提で、自分なりの解釈を持つことを第一義に考えたものなので、信頼性は保証されません。

また地方ごとのデータの現れ方は東京都とはかなり異なっていることもわかってきているので、東京都での傾向が当てはまるわけでもありません。さらに都内でも都心23区と多摩地域、島嶼部ではまったく違った傾向が出ています。この辺りの違いは感染を防止する知見に繋がるので関心は高いですが、現下のデータでは対応できません。

陽性者の推移

まず全体像を把握するために年初からの陽性者数の推移を見ます。横軸には週番号を採っています。30週前後(8月)のいわゆる「第二波」と呼ばれたピークが20代、30代を中心とする若い世代での陽性者の増加でしたが、40週を過ぎた辺りから同年代でまた陽性者が増え始めました。しかし、40代以降の陽性数は8月を大きく上回っており、若年層とは異なった現れ方をしているのが特徴的です。

但し以前こちらでも指摘しましたが、常時都民全員を検査しているわけではないので、陽性者の現れ方には検査の方法(検査対象の選び方)が大きく影響します。特に8月を中心とする夏期はいわゆる繁華街の「接待を伴う飲食店」を集中的に検査したことから、その傾向が結果に現れていると考えるべきです。しかしその後は区部で独自の検査をしたり、民間の検査が加わったりしているので違った傾向が出ているはずです。

検査標本の属性については、10月以降の陽性者につき、職業、濃厚接触歴が追加されました。今回の分析はそのへんも加味してみました。

検査態勢の影響

次のグラフが端的に表現しているのは、11月の陽性数の増加は、検査態勢が拡充された(一日あたり6千人から8千人に)ことです。線の傾きは各月ごとの陽性率の平均を表していますが、11月は6〜8月の陽性率とほぼ重なっています。したがって、11月の陽性者の増加は率の増加と検査数の増加の両方の影響を受けており、10月と比較すると、一日あたりに平均すると、陽性率の上昇で150人(x=6000における10月11月のyの差)ほど増加し、検査数の増加で130人(11月のx=6000とx=8000とのyの差)程度増加していることがわかります。

なお、下のグラフは11月の日別の陽性者数と検査数とをプロットして線形回帰したものですが、平日と土曜日、日曜日で検査件数に傾向が分かれているのが読み取れます。検査数のばらつきによる陽性数のばらつきはかなり幅がありますが、陽性率はほぼ直線上に並んでいることからかなり安定していることがわかりました。ゆえに、感染状況の推定には日々の陽性数(≠感染者数)よりも、陽性率の変化を見ていくべきでしょう。

職業との関係

陽性者はいわゆる「夜の街」での「濃厚接触」で発生するというのが定説ともなっていますが、10月以降の陽性者数を職業別に見ると、職業不詳がもっとも多く行政が税金を投入して集めているデータとしては質が悪いとしか言えません。それ以外では、会社員が圧倒的に多数を占め、ついで無職、学生の順となっています。東京都民が対象なので会社員や学生がそもそも多いので、その割合の傾向は特に違和感はありませんが、会社員と学生はいわばリモートワークとかオンライン講義が最も進んでいるはずのところで、絶対数の比重を占めているのはまだまだ対策のしようがある可能性を示しています。データとして片手落ちなのは、陰性者の職業などが全く不明なので、職業別に集計したときに陽性率にどの程度の違いが出てくるのか(あるいは出ないのか)が読み取れないことです。

一方で、飲食業は都内の店舗数や働いている人の数を考慮しても意外に少ないので、「不明」の方にカテゴリされているケースも多いのかもしれません。いずれにせよデータがしっかりしないと分析もあやふやになる悪い例です。

年代別に陽性者を見ても、勤労世代では全て(不明を考慮しても)会社員が最大です。

濃厚接触

陽性者の濃厚接触率は四割程度です。但し10代以下の陽性は過半が濃厚接触であり、いわゆる家庭内での接触が多いとされる根拠が読み取れます。また70代以降も濃厚接触割合が半数に近いことがわかりますが、これは検査対象が病院や老人施設などを中心に選ばれている可能性もあるので、家庭内接触とあわせて、「接触せざるを得ない」立場の人たちが陽性者となっている可能性を示唆します。

但しこれを早計に、子供と老人が犠牲になっていると解釈すべきではありません。単に行動範囲が狭く濃厚接触が追跡しやすい年代であることがデータに反映されていると考えるべきでしょう。反対に勤労世代は濃厚接触割合が低く、陽性者の絶対数が多い層で濃厚接触を追いかけることの意味がどこまであるのか疑問です(あくまで素人考えとお断りしておきますが)。

重症者の状況

covid19は、感染したら肺炎にかかり呼吸困難で死に至るというイメージが強調されますが、集中治療室で人工心肺装置を必要とする重症者は二桁台です。夏の第二波でもほとんど増加することはなかったのですが、11月に入ってから増加傾向にある点が、もっとも憂慮すべきところでしょう。一方で、死亡者数はとても低位で安定して推移していることから、医療機関の優秀さをあらためて認識するデータとも言えますが、重症者の急増傾向は5月のグラフと相似形なので、予断を許しません。

本来ならば重症者は死亡リスクが高いので、年代別に重症者がどの程度いるのかを知りたいのですが、データは公表されていません。そこで代替データとして入院ステータスがどの程度の日数に分布しているかを調べてみました。

下のグラフは調査日現在の陽性者が「退院等」の状態になっていないデータを陽性者として報道発表された日から調査日までの経過日数を算出して分布を見たものです。各年代において4分の3の人たちが入院2週間以内であり、外れ値となっている黒点が長期入院者ですが発表されている重症者との個々の対応関係は不明です。グラフは50日で切ったので、実際はそれ以上の入院者がデータ上は存在しますが、データには「退院の把握には時間を要している」との脚注がついているので、追跡しきれていないのでしょう。年代別の傾向を見る参考程度のデータでしかありませんが、高齢者ほど陽性者は少なくなるものの入院日数が分散し長期化する傾向は読み取れます。

発症者の状況

重症までには至らないが、喉の痛みや乾いた咳、発熱などの風邪の症状とほぼ同じ症状が出ている割合を示しています。折れ線が右端で急に下がるのは、発症者のデータ捕捉がやや遅れるため未集計の部分が含まれています。発症者は陽性者の推移とほぼ並行していることがわかりました。

年代別に発症者を見ても、陽性者のほぼ半数が発症者であるという傾向は、年代による違いはないようです。

発症者と濃厚接触者の関係を見ると、濃厚接触の有無に関係なく発症(右側)は増加傾向にあるものの、濃厚接触者でない発症者(右下)がより増加傾向にある点は注目すべきでしょう。つまり、ここでも濃厚接触関係からクラスターを通じて感染を追跡するという方法は限界に来ていることを示しています。

なお左下のグラフの直近部分が急増しているのは、捕捉が遅れているからで、大体一週間で他の3つの象限に割り振られます。

死亡者

8月以降、亡くなっている方は週2〜3人程度で安定的に推移しており、5月前後の状況と比較してみても、医療態勢が大きく変わったことが伺えます。端的には病院や福祉施設での集団感染が原因であったので、その知見が活かされているということでしょうか。令和元年の東京都人口動態調査で死亡数は 120,870 人なので、概算で一日あたり333人が亡くなっており、その下一桁に影響している程度です。この数字の推移は東京都の人口や日々他の原因で亡くなっている人の数からしても驚異的な低さです。

covid19を原因とする死亡者は6月までと、8月までと、9月以降の3つに相がきれいに分かれています。6月までの傾向に比べれば、9月以降は落ち着いていることがわかります。一方で、8月の第二波以前から傾向に変動がないことから、陽性となっても死亡確率への影響は極めて低いと考えるのか、報告されている死亡者はすべてが新型コロナ肺炎と確定診断された人なのか、データの裏付けがほしいところです。

上のグラフは単純に日々の死亡者を累計していったものですが、下のグラフは日々の陽性者数の累計と対比させたものです。5月あたりの傾向を見ると陽性の発生がほとんどないにもかかわらず死亡者は急増、11月は陽性数に引っ張られてむしろ傾きが緩やかになっており、陽性と死亡との間にはかなりの時間差があることが伺えます。但し5月頃はまだ検査体制が十分ではないため、統計上の陽性者数は6月以降よりは少なめに出ていることには留意が必要です。

死亡者は陽性から2〜3週間で亡くなっているケースがほとんどです。

年代別に見ても、40代以下はサンプルが少なくデータにばらつきがありますが、60代以降は診断から死亡までの日数は2〜3週間という傾向は変わりません。つまり、11月後半の陽性の増加が死亡数に反映されるかどうかは、今後12月前半の傾向を見ることである程度見えてくるはずです。

なお、亡くなっているのは男性が1.5倍程度で、80代以降の女性人口が多いという性別構成を考慮しても、男性の死亡傾向が高いのは明らかです。この辺りの要因分析は、総体としてのcovid19による死亡傾向ともあわせて興味のあるところですが、データが公表されていないので、疫学的な研究が発表されるのを待つよりないのでしょうか。いずれにせよ死亡者は還暦以降が大宗でありそれ以外は例外的であることを踏まえ、老人に対する感染防止対策が重症者や死亡者を抑えるという意味では肝要であり、若年層への対策は行動抑制よりも自己防衛と老人や有病者への配慮を啓蒙することのほうが重要でしょう。

Print Friendly, PDF & Email

Tags:

コメントを残す

メールアドレスが公開されることはありません。

超難解計算問題 *