var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

大数据还原病毒扩散路径:哪些城市压力更大?

来源:21世纪经济报道、21数据新闻实验室、澎湃、DT财经 / 作者: / 时间:2020-04-05

数据分析病毒扩散

112日,一位常住湖北黄冈的居民坐上了前往广东珠海的高铁。到达的第二天,她开始咳嗽,以为是普通感冒,自己就先买了点药吃着,可是症状并没有得到缓解。

119日,她因咳嗽加重来到中山大学附属第五医院诊治。

三天后,晚上10点,她被确诊为新型冠状病毒感染肺炎患者。这天是121日。

她不知道的是,再过15天,黄冈会累计确诊1645例新冠肺炎病例,

全国确诊病例分布图


有类似情况的还有孝感、荆门和襄阳等湖北地级市。

甚至1000公里外的浙江温州、广东广州、深圳等城市,也因与武汉的密切人员往来,随着春运返乡的开始,慢慢成为了重点疫区。 

而这一切究竟是怎么开始的?目前的疫情又发展到了什么阶段?在接下来的时间里,哪些城市将面临更大的压力?

本文除了结合案例数据详细还原病毒扩散的路径外,还将案例数据汇总在一起,拼贴出疫情的感染、死亡和治愈特征画像,并结合数据和专家观点观察疫情走向。


还原新冠病毒扩散的路径

澎湃新闻从截至127日的各地卫健委公布确诊病例中,搜集并分析了763例确诊患者的详情,试着还原病毒扩散的路径。

值得指出的是,各地之间的个案数量差异主要因为政府的信息公开程度不同,因此地区之间的数量不具有可比性。

368名后期确诊患者在武汉封城前一周离汉

1月23日早上10点,武汉关闭机场、火车站离汉通道,而这距离今年春运正式开始的110日已经过去了13天。

确诊患者出入城市分析图

过去的这13天,正是每年人们固定返乡的日子。没有多少人被警示到,大家依旧像往年一样,拿起行李,探亲、出游、回家聚餐。 

如上图所示,在506例有明确行程信息披露的病例里,368例在武汉封城前一周离汉。出入武汉的后期确诊患者人数高峰期在119日和20日,这两天一共有130名后来确诊的患者出城,占到了总数的27%

1月20日晚,钟南山在央视《新闻1+1》栏目中确认了病毒具有人传人的特征。从那天晚上,再到武汉23号封城,又过去了3天时间。21日,56名后来确诊患者出城;22日,62名;23日,36名。


47名患者离开武汉后曾去过不止一个城市

来自河北邯郸的一名患者,115日和父母一起到武汉旅游,18日移动到厦门,19日发病,22日抵达深圳就立即入院就诊。 

和他一样,离开武汉可能只是很多人春节出行的步。在公开的506例确诊患者行程中,47名患者从武汉离开后,又经过了多个目的地,占到了总数的9%

数据分析图形

此外,还有28例确诊患者案例显示,他们和武汉并无直接交际,仅有湖北其他省份的旅游史。更有甚者只因在旅途中途经武汉而患病。 

安徽合肥的叶某,19日前往湖南郴州出差,中途在武汉换乘,110日返回合肥。110日发病,123日确诊。

还有一名长居深圳的患者,119日从深圳出发前往天津,高铁在武汉停留了数分钟,122日到达吉林市,127日在当地确诊。

不过,停留时间的长短和后期是否患病确实没有直接关系。如下图所示,67名短暂停留过武汉的患者中,17人仅停留,4人停留了不到。

武汉短暂停留人数分析


值得指出的是,上述数据也只反映了患者行程的一部分,只有少数患者的城市内部移动轨迹得以公示。

从出现症状到就诊入院长间隔近一月

防控在于警示这次疫情其实各方面对我们信息的披露是不满意的,武汉市长周先旺27日接受央视访问时表示。 

确诊患者从出现症状到就诊入院的时间间隔变化,侧面验证了这一现象。由于新冠肺炎症状和普通感冒很像,大多患者甚至医生一开始并不能察觉到患病的严重性。

陕西安康市的一名患者,长期在湖北十堰居住,他早在12月底就出现了症状,但直到121日才到白河县就诊。

山东成武县的患者田某,长期在湖北荆州工作。19日返回老家,120日出现症状,当日在村卫生室输液治疗,未见好转,22日前往成武县田集镇卫生院就诊,依旧未见好转,23日到成武县医院就诊,被隔离治疗。126日确诊。

患者出现症状分析图

如上图所示,以118日作为分界点,前后的时间间隔差距很大。特别是从122日起,当日出现症状即就诊的患者数量剧增。这天,湖北省启动了突发公共卫生事件二级应急响应。第二天,浙江、湖南、广东相继启动了一级响应。 



家属和同事是人传人特征的主要受害者

以上所述的时空特征,再加上人传人的特征,带来的后果就是大批的后期确诊患者早已到达全国各地,将病毒带给密切接触者,甚至引发聚集性传染。据新华社报道,截至24日中午,山东省发现聚集性疫情60起,其中49起为家庭聚集性疫情。 

总体而言,家属和同事是主要受害者,因为他们属于每天在熟人空间能遇见的人。在151例人传人确诊患者中,共有64例属于这种情况。下图以山东和天津的两组传播为例。

疫情接触熟人分析图

公共空间也是病毒传播的重要途径。在151例人传人确诊患者中,共有20例属于这种情况。他们之中,有的人是因为参加了同行者中有武汉籍患者的云南旅行团,有的人是因为和武汉籍患者同事聚餐,还有的人则是因为在公共交通工具上遇到了武汉旅客。

公共区域分析

一种常见的人传人场景则是在医院。这种传染案例的详情公布得不多,截至127日,仅有以下来自江西新余市的5例。5名医院职工被感染,其中两名又分别将病毒传染给了自己的母亲和妻子。

医疗互动分析

死亡和治愈病例有何特征?

能给我们哪些启示?


真实病例表现表现出怎样的特征? 

21君在此分享DT财经的一篇大数据报道,具体情况如下:


新冠病毒肺炎感染者的特征

对于感染者的特征研究,下面的分析直接引用了疾控中心主任高福、副主任冯子健于129日发表在《新英格兰医学杂志》上的论文《新型冠状病毒感染肺炎在武汉的初期传播动力学》。 

目前关于这篇论文的争议很大,暂且不表。但它确实是目前对感染者为详尽的研究,样本包含了122日前武汉的425名新型冠状病毒肺炎感染者。

其中引起争议的部分是关于病例接触史的分析。

数据显示,202011日之前的感染病例中,虽然大部分(55%)去过华南海鲜市场,但亦有26%的病例既没有去过海鲜市场,也没有接触过有明显症状的人。

从这些较早感染者的整体情况来看,中老年男性是更易感的人群。425例患者中,近一半的患者年龄大于60岁,56%240例)是男性。

疫情年龄分析图

但是,将这些病例分为三个时期进行比较观察后,可以看到感染人群特征在变化: 


一方面,在112-22日感染的患者中,女性的比例超过了男性,这一定程度上推翻了前期的男性易感结论;

另一方面,感染人群的年龄下限在降低,11日前年轻患者是26岁,11-11日是21岁,112-22日的年轻患者只有15岁。


目前并不确定感染人群特征变化的背后,是病毒在变化,还是因为传播路径的影响。总之,虽然整体看来中老年男性更加易感,但是新型冠状病毒已经开始展现出男女平等、兼顾各个年龄段的趋势。


死亡病例的特征

死亡病例的特征与感染者整体特征有些偏差。

45条可查询到详细信息的死亡病例作为样本,我们从年龄、性别、过往病史以及接受治疗时间这四个角度分析。

疫情死亡特征分析

从年龄分布来看,56个死亡病例年龄区间为36岁到89岁,跨度为53岁;在这些病例中,年龄的中位数是72岁,其中84%的年龄超过了60——死亡病例中老年人的比例明显要高于感染病例中的比例。

在死亡病例的分析样本当中,近7成为男性。结合前面对确诊病例的分析来看,这一定程度上是受到早期感染者的性别比例影响,11日前确诊感染病例中男性的比例就高达66%

具有基础疾病,是许多死亡病例详情中都会介绍到的情况。在这45例死亡病例当中,有6成(27人)曾有过往病史,其中主要的三大过往病史分别为高血压、糖尿病以及慢性支气管炎

15人曾患有高血压,10人曾患有糖尿病,有6人曾有过慢性支气管炎病史。而在10名曾患有糖尿病的病例中,有7人同时患有高血压等其他疾病。


看看这些病例接受治疗的时长。

此次共有37例死亡病例公布了死亡之前的治疗时间,跨度在1天到22天之间,治疗时间的中位数是7天。死亡病例接受治疗时间的众数为4天,一共有7人在接受治疗的第4天死亡。超过8成的死亡病例接受治疗时间不足两周——也就是不足新型冠状病毒肺炎的一般治疗周期。

这一定程度上意味着,新型冠状病毒感染导致的死亡病例,大多并没有熬过一个治疗周期。


治愈病例的启示

关于死亡的讨论总是非常沉重,但在死亡病例之外,也有治愈病例。总体上来看,截至13124时,共有243位感染者治愈出院。通过各地卫健委和公开报道的37例详细数据,并从年龄、性别、接受治疗时间和地区分布来分析这些人的特质。

治愈病例启示分析

在年龄上,治愈出院的病例整体要比感染人群年轻——甚至年轻得多。在有记录年龄的31例治愈病例当中,年龄的中位数为38岁,过半病例没有超过40岁,九成没有超过60岁。年轻人在这场没有硝烟的战争当中,的确存在一定的优势。

性别上的分析结果也较符合市场预期。由于前期感染病例大多为男性,所以相对地,治愈出院的病例当中也有将近65%的人为男性。

从治疗时间来看,在治愈病例当中,接受治疗天数的中位数为9天,众数为7天,都比死亡病例的接受治疗时长略长几天。综合比较死亡病例和治愈病例,一定程度上可以认为,要打赢新型冠状病毒,很重要的是得撑过接受治疗的周。

把观察点落在了地区分布上。除湖北以外,广东、浙江和上海是治愈人数多的三大省份。其中广东和浙江是除湖北外疫情为严重的地区,但到目前为止还没有死亡病例出现,治愈病例则在不断增加。

如果把观察样本扩大至治愈人数排在前10的省份,依次还能看到江西、北京、河南、安徽、湖南、山东、江苏等省份名。从实际案例来看,经济发达地区的应对水平仍然值得信任。


哪些城市压力更大?疫情什么时候可以控制下来?

截止2624时,全国新增疑似病例4833例(5日为5328例),其中湖北新增2622例。

值得注意的是,全国非湖北地区新增疑似病例出现轻微上扬之势,这或许与陆续出现的返工潮有关。因此,疫情防控仍不可放松。

疑似病例分布图

百度迁徙数据显示,在2020年除夕前这一周,迁出人口数量多的城市主要集中在珠三角、长三角和成渝;其中深圳、北京、上海、广州、成都是迁出人口数多的五个城市,而东莞、苏州等制造业城市和郑州、杭州、西安等重要节点城市,也在春运前迁出了多的人口。

百度春运图

22日的少量返工人口流动来看,上述城市确实是热门的目的地。

复工热力图分析

(图片说明:202022日全国热门迁入地/目的地,图片来源:百度迁徙)


在湖北正在尽全力实现应收尽收、应治尽治时,湖北外的城市们也在跟时间赛跑——尽快将疫情传播控制下来,以小的风险去迎接返工潮的压力。

目前大家关心,也是关键的问题是,疫情什么时候可以控制下来?拐点如何才会到来?

7日下午,钟南山院士回应“#全国新增确诊病例连续两天明显下降#”时表示,这并不能证明拐点到来,他个人估计这个拐点到来还得有几天。现在看起来早发现、早隔离的工作开始起效了。


医学科学院院长王辰25日对话白岩松时表示,拐点预判的难点在于:

疫情的底数不明,判断根据不足;

很多人还没隔离,社区、家庭传播相当严重;

此次爆发的是新将人体作为宿主的病毒,适应宿主的过程会促使病毒变异,但变异过程未可预期;

大批人员即将返程流动是个考验;

或许还有天气变暖的因素。


世界卫生组织发言人贾萨瑞维奇6日接受《环球时报》记者采访时也表示,现阶段尚不能预测疫情的拐点何时到来,也无法预测新型冠状病毒肺炎疫情是否会在以外大规模爆发或演变成全球性流行病,因为新型冠状病毒仍有大量关键信息未能为世界科学界所掌握。

但他同时表示,只要各国采取强有力的措施,及早发现、隔离、治疗并追踪接触者,采取与风险相称的社会阻隔手段,阻断病毒蔓延依然是可能的。

美国加州大学洛杉矶分校(UCLA)公共卫生学院副院长、流行病学资深终身教授张作风认为,湖北确诊病例占全国超70%,要重点做好湖北、以及与湖北邻接的河南、湖南等病人的诊断,把可疑病人尽快排查,诊断出来后,疫情拐点才会浮现。

当然,从乐观的方面来想,拐点预判不一定准确的点还在于,如果药等有效治疗手段突然出现,新冠病毒肺炎变得不再那么可怕,致命性大大降低,变得比流感还要寻常。那么,即使没有消灭它,我们也不用再如此严阵以待。 

无论如何,要迎来拐点,现阶段的关键还是得我们共同发力。在这个关键时刻,希望不要过度悲观、盲目乐观。尽量少出门,不让自己感染的同时,把资源留给真正有需要的人。

,借用上海医疗救治组组长张文宏的一句话:从现在开始,每一位都是战士。你闷两个礼拜就把病毒给闷死了。你在家里不是在隔离,你是在战斗啊!


(资料来源:21世纪经济报道、21数据新闻实验室、澎湃、DT财经)



Prev article

遗忘在角落里的数据库-Access

Next article

数据分析行业关于抗击新型冠状病毒肺炎疫情倡议书

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务