来源:数据分析师 CPDA | 时间:2019-07-29 | 作者:admin
《长安十二时辰》近期大热特热。微博话题的讨论量达到了近60亿,还带动了“线下长安”旅游热度的暴涨。同时还把这股势头带到了海外疯狂输出,成为首个在Viki、Amazon、Youtube三大平台上同时付费播出的国产剧,堪称“国剧之光”了!
这部新晋的豆瓣8.6分的高分剧集,用一句话概括,就是一个古代版“西安反恐24小时”的故事。
背景设定在天宝三载上元节,主要讲负责长安反恐与情报工作的靖安司(类似FBI)任用已是死囚的不良帅(不良人首领,类似间谍人员的长官)张小敬在十二个时辰内调查,阻止狼卫(类似恐怖分子)等多股势力谋划的恐袭活动。
想要观望偌大的长安城,监测城内的动态,望楼这种高层建筑是十分理想的。每个望楼上设置了数名武侯(士兵),他们往往数人一组,分别负责瞭望,保卫,传信等工作。
望楼系统
要说望楼系统在剧中最集中的体现,张小敬追捕携带伏火雷(易燃易爆物品)的3辆恐袭车辆场景当属其一。小编细细拆分了整个追捕过程:
负责瞭望的武侯不断瞭望与发射烟丸标记携带伏火雷的恐袭车辆位置;
武侯发射烟丸
望楼上的武侯利用鼓声与预先设置好的图形编码系统向靖安司(反恐指挥中心与数据中心)传递最新信息;
图形编码系统
靖安司司丞李必收到信息后一般会向徐宾等靖安司职员分发任务;
靖安司职员调出长安沙盘,根据武侯传递的信息与李必的指示在沙盘上推演追捕行动;
沙盘推演
李必决策,通过望楼系统传递信号,指导或协助张小敬的一线追捕工作。
emm....这个工作流程是不是十分眼熟?当小编梳理了靖安司追捕工作的基本流程后,突然灵感一现:靖安司的追捕工作不就是一个完整的数据分析工作流程吗,甚至还用到了“大数据技术”?
靖安司追捕工作流程
数据分析工作流程
如果把长安比作一个大的网站页面,携带伏火雷的恐袭车辆就是带有特殊标记的字段,望楼系统不就是分布式爬虫吗?
爬虫获取恐袭车辆位置数据,并将数据编码为鼓声或图形信号传递给各个爬虫节点(望楼系统)与指挥中心与数据中心(靖安司);
指挥中心与数据中心对信息进行解码,存档,并将信息传递给中央处理单元(司丞李必);
中央处理单元向计算中心(徐宾等记忆能力,计算能力超强的靖安司职员)下发任务,有些任务还需要使用到“大案牍术”算法;
生成可视化图表(靖安司职员推出长安的沙盘并按照武侯最新情报和李必的指示推演追捕行动);
中央处理器(李必)做出决策,通过望楼传递指令指导前线追捕工作。
剧中反复提到的“大案牍术”是什么?
一开始小编以为是“大案·牍术”,案卷集啥的。后来发现,这不就是“大数据用户画像”嘛!在唐朝其实是不存在的,由原著马伯庸杜撰出来的一种算法。
大案牍术
因为张小敬做事不按套路出牌,为了更深刻地认识张小敬,李必对张小敬及相关数人进行了“大案牍术”。作为力推张小敬查案的靖安司主事徐宾,从青年时期的发展路线、消费记录,如徐宾喝酒常喝一些劣质酒且赊账等信息一一呈现在李必面前。不得不服,优秀的剧集就是走心,紧跟时代的发展趋势!
剧情推进到这里,参与反恐工作的旅贲军、不良人等武装力量损失惨重,小编心疼不已,心急如焚,恨不能帮助破案。
遭恐怖分子破坏的靖安司
设想,如果靖安司获取了三种武装力量({‘安保部队:旅贲军’,‘间谍部队:不良人’,‘恐袭部队:狼卫’})的一些数据,根据不同类型的武装力量中个体的身高、服饰偏好(主要看色彩)进行了分级打分。数据集(非真实数据,仅做探究,此处相当于训练数据)中有身高与服饰的偏好两个维度的分数。我们利用散点图来查看不同类别的武装力量在身高与服饰偏好上的一些关系,探索是否能通过身高与服饰的偏好来查找出长安城中的狼卫。
设想的三种武装力量特征探究
从可视化的图表来看,三种不同的武装力量在身高与服饰偏好上确实存在明显差异。在实际应用中,如果在模型中“灌入”更多维度,准确的样本数据,靖安司就有可能获得更为精准的“恐袭分子(狼卫)识别模型”。而这,不就是最简单的机器学习应用嘛!!!
驾车逃窜的恐怖分子