2013突破性科学技术之“小手机大数据”

从廉价手机上收集来的信息经过分析之后可以帮助科学家了解人们的日常行为和旅途,甚至可以弄清楚疾病的传播。

坐在哈佛公众健康学院的办公室里的流行病学家卡洛琳·巴克伊,指着电脑屏幕上的肯尼亚地图中的一个电话信号塔,说道:在对抗疟疾的过程中,从手机信号塔收集到的数据对于流行病的控制起到了关键作用。

她和同事在研究数据的过程中发现人们在Kericho这个地方的信号塔附近发送短信和拨打电话的次数是其他区域的16倍,而且非洲维多利亚湖东北侧的一个地方发送短信和拨打电话的次数也是其他地区的3倍,而这些地区都被相关国家的卫生部门认定为是疟疾传播热点。就在这些区域内,蚊子疯狂地传播者疟疾。通过对信号塔的数据分析,他们绘制了疟疾传播路径图,意味很明显,“患虐记者所经之处必然会引发更多人患上疟疾。”

卡洛琳目前正在构建一个全新的预测模型,其中就包括了这一路径图。找到病源并非难事,更难的是如何借助信号塔和移动通讯公司的数据,分析出带病患者何时到来何时离开,去了何处。卡洛琳说:“虽然也有人从事人员出入境、患者医疗登记工作,但是在非洲,这样的数据有跟没有没什么区别。所以为了解决流行病传播的问题,我们想到了之前从来没有人用过的办法。”

即数据挖掘,从移动通讯企业那里获取机主的使用记录,并配合政府部门发布疾病预防公告。“我们不可能顾及到所有的疟疾病人,但是却可以根据疟疾的传播路径来告诫、提示人们。”

卡洛琳和丈夫南森·伊高合写的一篇针对肯尼亚1500万手机用户的调查论文于去年在《科学》杂志上发表。一个是流行病专家,一个是手机数据专家,两人共同在非洲进行了18个月的调查,通过手机数据对民族分裂、疾病传播等多个项目进行了研究,他们的研究结果不仅见解独到,而且可以切实地帮助人们拥有健康的生活。

伊高说:“这就是流行病学的未来。想要灭绝疟疾,就得利用这种方法。”

崭新的一页

全球一共有60亿部手机,这些手机每天都会产生无数的数据,包括位置、商业活动信息、搜索记录和社交记录等信息。其中,有50亿部手机分布在发展中国家,而且绝大部分手机是价格便宜、功能简单的“破”手机,只能打电话、发短信。但是手机的功能并不会影响其“大数据”功能,通过信号塔的跟踪,可以大致地描绘一个人的生活轨迹,这不仅对流行病传播的研究有益,还可以用来研究就业趋势、社会压力、贫穷状况、交通等。

对于许多贫困的国家来说,通过廉价手机所收集到的数据比详细、实时但极少的信息更有用。麻省理工学院人类动力学研究室主任Alex Pentland说:“在发展中国家,不可能开展有效的普查,也得不到详细的交通信息,政府甚至都没有数据收集设备。但是,有一个东西确实随处可见的,那就是手机。在过去几年,手机迅速普及,就连发展中国家也几乎人手一部。”数据分析的软件和方法都已经普及,为数据挖掘扫清了道路。

高效利用手机数据的案例是2010年的海地地震。2010年1月,海地发生地震,造成至少20万人死亡,研究人员根据从海地第一大通讯运营商那里获得数据,分析了地震前42天和地震后158天的数据,发现在地震发生后三周内有63万人逃离首都太子港,而且在拿到数据之后的12小时就计算出了有多少人跑到了霍乱爆发区。因为运营商的数据比较详细,几乎可以做到实时监控。更关键的是,研究人员还利用这些数据开发出了灾害预测模型,发现当海底人遇到灾难时,更偏向去自己曾经去过的地方避难。

初现规模

去年,著名移动运营商Orange发布了非洲象牙海岸5个月内的手机通话记录,包含25亿条信息,这对于数据专家来说,是一座金矿。全球有接近100个研究机构拿着这些数据在做研究,手机数据挖掘初具规模。与此同时,利用数据做生意和隐私保护问题也开始出现。然而为了让数据挖掘工具发挥最大的功效,光有通话记录是不够的,还需要更详细的数据,比如说小规模的调查问卷。

卡洛琳希望通过挖掘手机数据来完全消灭疟疾,“这就是流行病学的未来,如果我们想灭绝疟疾,就得利用这种方法。”