image.png

首先,请想象一个简单的数学模型来预测冠状病毒的结果。死亡人数取决于感染人数,病毒传播方式以及病毒能够杀死的人数。
image.png
简单的来说,就是
N(死亡人数) = N(易感人群) 感染率 致死率

但这几个指标很难直接获取到数据,考虑一些基本的数据输入,不同的国家和地区以不同的方式收集数据。无法每个人都填写一个电子表格,然后轻松地让我们比较世界各地的病例和死亡人数。在世界上很多国家,也都很难充分报告因COVID-19导致的死亡总数。

相同的困难出现在接受检测的人员。一些国家正在对任何想要测试的人进行检测,这影响了我们获取较为准确的数据,到底对多少人实际感染COVID-19以及多少人测试呈阳性。

而且,病毒本身是无法预测的传染病,对某些群体的伤害要大于对其他群体的伤害——这意味着,就病毒对社区的影响而言,当地人口统计学和医疗保健获取将是决定性因素。俄亥俄州立大学流行病学教授比尔·米勒博士说:“作为公共卫生人员,我们经常在黑暗中工作,试图用真正不确定的信息做出最好的估计。”

因此,让我们探索一下我们的超级简单模型,以了解为何很难为如此不确定的事物建立好的模型。

致死率

image.png
有些人因感染病毒死亡,那也许是我们在这里可以做的最后一个绝对声明。但是“有些”不是数字,您不能用数学来计算。问题是,从一开始就计算病毒的致死率是模糊的。各个队列之间的差异很大。加州大学旧金山分校的生物统计学家Rae Wannier说:“由于年龄是一个很大的因素,您必须调整国家人口结构的病死率,以及并发症的发生率。” (并发症是可能加重COVID-19影响的其他潜在疾病和状况。)换句话说,“致命率”至少会随年龄变化,不是一个常量。

中国的病死率将不同于糖尿病发生率较低的国家的病死率。在中国,死亡率也可以说是相同的——如果该病毒在人口众多的大都市地区蔓延,那么计算出的死亡率将比震中位于年轻的城市更高。但是,让我们暂时保持国际化。了解美国或意大利的COVID-19的死亡率,是否可以告诉我们中国的死亡率?它当然有帮助——但这只会降低不确定性,并不能使事情确定。

当然,无论如何,我们可能不知道这些地方的实际死亡率。出于多种原因,这是正确的,首先是收集有关冠状病毒病例的基本数据。数字不是事实。它们是许多主观选择的结果,必须透明,详细地记录下来,然后您才可以考虑将输出视为事实。数据的收集方式以及每次是否以相同的方式收集数据都很重要。

还存在数据未收集或不准确的问题。要确定致死率,您必须将该疾病的死亡人数除以该疾病的感染人数。在这种情况下,我们并没有确切的受感染人数统计信息——因此,从数学上来说,我们不知道分母。(如果说实话,我们也许也不确切知道第一个数字是分子是什么,但是我们假设它更接近正确。)

image.png
Diamond Princess游轮上的数千名乘客接受了COVID-19的测试。出现的数据可以告诉我们其他人的感染率和死亡率,但这并不是一个完美的对比,因为我们其他人都不住在游轮上。卡尔·法院/盖蒂图片社

在理想的世界中,我们将测试人群中每个人是否感染了新型冠状病毒,以便我们可以肯定地知道有多少人患有该疾病,以及有多少人因此而死亡。不过,在仅有的几种情况下,这种情况几乎已经发生。以钻石公主号为例,这是一艘在COVID-19爆发后被隔离的游轮之一。几乎所有船上人员都接受了测试(3,711人中的3,063个样本)。钻石公主号变成了一个活着的实验室,它具有我们通常在现实世界中通常不会遇到的那种数据记录条件。研究人员不仅能够捕获有多少人患有该病,而且还能捕获有多少人完全没有症状-因此,如果他们在陆地上,它们很可能未经检验,未被诊断和计数。

这种异常设置的结果表明,有很多人不知道COVID-19到处走动——因此,死亡率低于其他数据所建议的水平。在钻石公主人群中,有诊断和症状的人的死亡率为2.3%,但所有诊断出的病例(包括无症状的人)的死亡率为1.2%。在冰岛,一家名为deCODE Genetics的公司于3月13日开始为无症状的普通人群提供免费筛查。截至3月29日,deCODE在8694份检测样本中确定了71名感染者,其中包括无症状感染。

同时,有症状的比率(有症状和无症状的人数)很重要,我们现在大多只是在猜测。伦敦帝国理工学院的报告假设,三分之二的病例有症状,足以使感染者注意到并自我隔离。钻石公主的数据发现,在诊断时,大约一半的病例是有症状的。对症比率实际上是什么将改变死亡率计算。

钻石公主号的数据并不是完美的——他们并没有对所有人进行测试,游轮人口统计数据不能代表更广泛的人群,某些病态的乘客仍可能死亡,这会增加死亡率。但您不会在陆地上找到更可靠的统计数据。冰岛的数据尚未以相同的方法详细程度发布。在美国,这种广泛的测试才刚刚开始,这确实很重要。如果您像某些州一样主要测试病人,则病死率将无法反映病毒的实际病死率(分母问题再次抬头)。此外,美国的测试还受到其他问题的困扰,例如总体上缺乏可用的测试,以及某些私人实验室未提供负面的测试数量的事实。

一旦某人患了重病,该疾病的真正死亡率也受到我们防止致死的能力的影响。而这取决于医疗能力。如果可以无限制地使用重症监护病房的病床和呼吸机,许多症状严重的人都可以在感染中幸存。但是这些资源相对稀缺,如果需求超过供给(如该国某些地区已经存在的那样),那么无法使用呼吸机的人可能会死亡。这可能会产生连锁反应。为不相关的事故或紧急情况而寻求治疗的人也可能会遭受医院资源的缺乏,即使可能由于与COVID-19无关的原因而可能导致的可预防的死亡,也会增加整体死亡人数,即使这些人不算为2019冠状病毒病死亡。

Wannier说:“我们是否最终会看到供应和人员短缺会严重影响死亡人数,而且我们的医疗系统是否具有弹性尚不清楚。”

感染率

image.png
我们已经说过的关于死亡率的几乎所有内容也适用于感染率:估计数都会受到数据收集,抽样和对症比率的影响。但是要知道感染率,您还必须找出病毒从一个人转移到另一个人的频率。(您可能已经听说过“基本生殖数量”或“ R0”一词,这是追溯到每个人都容易感染该疾病的人群中每个感染者的平均新感染数。)

事情是这样:传播方式可能会变化很大,取决于各种社会行为,当地环境细节和政治决定。从一个国家到另一个国家,情况会有所不同。从一个省份到另一个省份,情况可能会有所不同。它会随着时间的流逝而变化,这取决于我们采取何种措施来对抗该病毒。例如,在积水很多的地方,疟疾的基本繁殖数量更高。

因此,对冠状病毒的潜在结果进行建模意味着要尝试许多不同的传播方案。但是,即使是那些情况也不是很精确; 它们更像是一系列估计值。这些估算包含多个变量——每个变量本身都是变量。

第一个变量是接触率——基本上是一个给定时间内被感染者与之互动的人数。这是人们唯一可以控制的事情,这就是为什么每个人都在室内度过所有这些时间并谈论社交距离的原因。平均接触率不一致-每个人的平均接触率不同,具体取决于他们的生活状况和工作等因素,并且会根据公共卫生干预措施和位置而有所不同。“想像一下俄亥俄州阿巴拉契亚地区和克利夫兰市中心或哥伦布市区之间的接触率差异,”米勒说。

然后是每个触点的传输速率。这只是一种思考方式,即感染者遇到多少人会被自己感染。它也是一个移动的目标。病毒不会以每人两个新案例的有序传播。取而代之的是,案件往往发生在匆忙的高峰中,东北大学教授萨姆·斯卡皮诺(Sam Scarpino)对传染病进行建模,称这些事件为“超级传播事件”,在这种情况下,某些因素通常是与所在地有关,而不是与人本身有关,从而增加了突发病例数。想一想一次Biogen会议,该会议当时负责了马萨诸塞州诊断出的95例病例中的77例,或者是一手破坏韩国先前有效的遏制策略的女人。

还记得有症状的比率吗?有些人认为无症状携带者的传染性不如出现症状的人,因此传播率也与比率有关。

当您尝试计算每个触点的传播时,病毒生物学也很重要。其中包括病毒可以在表面上生存多长时间(以及病毒在其上着陆的表面)以及可以从空中抛射多远。对于新型冠状病毒,目前对这两个因素都有相互竞争的估计。然后,人体和行为也有所不同。例如,吸烟者可能更容易受到病毒感染和并发症的危险。尽管这很大程度上与吸烟对肺部的影响以及病毒一旦进入人体后的行为有关,但其中的一些原因还可能与当前吸烟者将手更靠近嘴巴的事实联系在一起。通常比普通人高,增加了传播风险。

最后,还有传染性的持续时间——一个人可以将病毒传播给他人多长时间,以及在疾病发展过程中何时会传染?俄亥俄州立大学生态,流行病学和人口健康计划的负责人马克·威尔说,这随病毒生物学和个体免疫系统的不同而不同。

所有这些参数都用于估计R0,即病毒的基本繁殖数。

基本的繁殖数量假设整个人口都是易感人群,但还有一个有效的繁殖数量,这取决于有多少人口易感。如此之多的人群被视为易感人群的原因之一就是新型冠状病毒就是这种新型病毒,以前没人来过。

一个好的模型还需要考虑再感染的问题:如果感染了这种病毒并康复的人免疫再次感染它,那么易感人群就会减少。但是到目前为止,我们对这种病毒的感染后免疫性了解不多。

如果发现了疫苗之类的东西,敏感性甚至不会改变。但是我们已经进行了足够长的时间。

模型整合

然后,要建立模型,您必须组装所有这些变量(以及我们的编辑器不会提及的其他变量),并考虑它们的不确定性,它们彼此之间的关联程度以及各种其他因素。可能会变得凌乱。

所有这些因素都可能受到我们为减少病毒传播而采取的所有干预措施的影响,这些干预措施包括社交疏散,洗手,停课,减少择期手术等。这是一个巨大的未知因素,可以极大地改变疫情的形式,但因国家,省份甚至城市而异。
image.png
想象一下这就像做馅饼。如果您有正常的食谱,则可以轻松完成,并期望得到可以预见的有意义的结果。但是,如果食谱中包含诸如“根据您手头上的食物添加3到15个切碎的苹果,牛排或球芽甘蓝”的说明,那么这将影响这块馅饼的美味,不是吗?您可以对正确的成分及其数量做出假设。但这只是假设,而不是绝对事实。而且,如果您在饼图制作过程中做出太多假设,那么您最终可能会得到与原本应该做的完全不同的事情。而且您不一定知道自己做错了。

在接下来的几个月中,您将看到有关COVID-19结果的许多不同预测。他们不会都同意。但是,仅仅因为它们基于假设并不意味着它们一文不值。

Weir说:“所有模型都是错误的,目前正在努力使它们减少错误和实用性。”

我们饿了,所以必须有人烘烤馅饼。但是一定要问一下哪个成分中加入了哪些成分,数量多少。

参考:[Why It’s So Freaking Hard To Make A Good COVID-19 Model]