2013突破性科学技术之“小手机大数据”

从廉价手机上收集来的信息经过分析之后可以帮助科学家了解人们的日常行为和旅途,甚至可以弄清楚疾病的传播。

坐在哈佛公众健康学院的办公室里的流行病学家卡洛琳·巴克伊,指着电脑屏幕上的肯尼亚地图中的一个电话信号塔,说道:在对抗疟疾的过程中,从手机信号塔收集到的数据对于流行病的控制起到了关键作用。

她和同事在研究数据的过程中发现人们在Kericho这个地方的信号塔附近发送短信和拨打电话的次数是其他区域的16倍,而且非洲维多利亚湖东北侧的一个地方发送短信和拨打电话的次数也是其他地区的3倍,而这些地区都被相关国家的卫生部门认定为是疟疾传播热点。就在这些区域内,蚊子疯狂地传播者疟疾。通过对信号塔的数据分析,他们绘制了疟疾传播路径图,意味很明显,“患虐记者所经之处必然会引发更多人患上疟疾。”

卡洛琳目前正在构建一个全新的预测模型,其中就包括了这一路径图。找到病源并非难事,更难的是如何借助信号塔和移动通讯公司的数据,分析出带病患者何时到来何时离开,去了何处。卡洛琳说:“虽然也有人从事人员出入境、患者医疗登记工作,但是在非洲,这样的数据有跟没有没什么区别。所以为了解决流行病传播的问题,我们想到了之前从来没有人用过的办法。”

即数据挖掘,从移动通讯企业那里获取机主的使用记录,并配合政府部门发布疾病预防公告。“我们不可能顾及到所有的疟疾病人,但是却可以根据疟疾的传播路径来告诫、提示人们。”

卡洛琳和丈夫南森·伊高合写的一篇针对肯尼亚1500万手机用户的调查论文于去年在《科学》杂志上发表。一个是流行病专家,一个是手机数据专家,两人共同在非洲进行了18个月的调查,通过手机数据对民族分裂、疾病传播等多个项目进行了研究,他们的研究结果不仅见解独到,而且可以切实地帮助人们拥有健康的生活。

伊高说:“这就是流行病学的未来。想要灭绝疟疾,就得利用这种方法。”

崭新的一页

全球一共有60亿部手机,这些手机每天都会产生无数的数据,包括位置、商业活动信息、搜索记录和社交记录等信息。其中,有50亿部手机分布在发展中国家,而且绝大部分手机是价格便宜、功能简单的“破”手机,只能打电话、发短信。但是手机的功能并不会影响其“大数据”功能,通过信号塔的跟踪,可以大致地描绘一个人的生活轨迹,这不仅对流行病传播的研究有益,还可以用来研究就业趋势、社会压力、贫穷状况、交通等。

对于许多贫困的国家来说,通过廉价手机所收集到的数据比详细、实时但极少的信息更有用。麻省理工学院人类动力学研究室主任Alex Pentland说:“在发展中国家,不可能开展有效的普查,也得不到详细的交通信息,政府甚至都没有数据收集设备。但是,有一个东西确实随处可见的,那就是手机。在过去几年,手机迅速普及,就连发展中国家也几乎人手一部。”数据分析的软件和方法都已经普及,为数据挖掘扫清了道路。

高效利用手机数据的案例是2010年的海地地震。2010年1月,海地发生地震,造成至少20万人死亡,研究人员根据从海地第一大通讯运营商那里获得数据,分析了地震前42天和地震后158天的数据,发现在地震发生后三周内有63万人逃离首都太子港,而且在拿到数据之后的12小时就计算出了有多少人跑到了霍乱爆发区。因为运营商的数据比较详细,几乎可以做到实时监控。更关键的是,研究人员还利用这些数据开发出了灾害预测模型,发现当海底人遇到灾难时,更偏向去自己曾经去过的地方避难。

初现规模

去年,著名移动运营商Orange发布了非洲象牙海岸5个月内的手机通话记录,包含25亿条信息,这对于数据专家来说,是一座金矿。全球有接近100个研究机构拿着这些数据在做研究,手机数据挖掘初具规模。与此同时,利用数据做生意和隐私保护问题也开始出现。然而为了让数据挖掘工具发挥最大的功效,光有通话记录是不够的,还需要更详细的数据,比如说小规模的调查问卷。

卡洛琳希望通过挖掘手机数据来完全消灭疟疾,“这就是流行病学的未来,如果我们想灭绝疟疾,就得利用这种方法。”

(责任编辑:蒙遗善)

时间: 2024-09-17 00:37:05

2013突破性科学技术之“小手机大数据”的相关文章

唤醒“沉睡”的手机大数据

近年来,伴随手机的普及以及移动互联网技术的迅猛发展,手机使用中产生的大数据资源的研究与应用价值受到学者们的重视.然而,合理开发.利用手机大数据的边界尚未确定,海量数据仍处于"沉睡"之中. 忠实记录用户行为 据2016年1月工信部发布的2015通信运营业统计公报,中国移动电话用户总数达13.06亿户.如此规模的移动电话用户群体将产生海量数据.同济大学建筑与城市规划学院副教授钮心毅介绍,手机数据包括通话详单数据.话务量数据以及反映手机用户在网络活动的信令数据,其中信令数据就是典型的大数据.

2013发展趋势盘点:广电云计算大数据厚积薄发

013年即将过去,回顾2013,承载着2012"三网融合"."OTT"."CDN"."互联网新媒体"的余温,燃烧着"4K"."4G"."大数据"."云计算"."FTTH"的炙热,在这一年广电发生着太多意料之中以及意想之外,在去年的这个时候,我们对广电行业的翘首以盼今年又有多少如愿以偿,慧聪广电网结合一年内的信息汇集,盘点2013

2013 Bossie评选:最佳开源大数据工具

MapReduce的出现是为了突破数据库的局限.Giraph.Hama以及Impala等工具的出现则是为了突破MapReduce的局限.虽然上述方案的运行都需要以Hadoop为基础,但图形.文档.列式以及其它NoSQL数据库也是大数据当中不可或缺的组成部分. 哪款大数据工具能够满足您的需求?这个问题在如今解决方案数量迅速增长的背景之下,确实不容易回答. Apache Hadoop 当人们说起"大数据"或者"数据科学"时,他们指的往往是Hadoop项目.总体而言,Ha

美国2013年高薪技术排行:大数据居首

最新调查显示,大数据相关技术囊括了技术领域高薪的Top 3,分别为Hadoop.Big Data及NoSQL.而苹果相关的岗位次之,比如Omnigraffle及Objective-C,而Java.C等主流技术领域的排行并不理想. 以下为译文: 也许一些企业至今还未真正了解大数据的价值,但是却并不影响他们在类似Hadoop及NoSQL等大数据技能上的大笔投资.通过一个2013 Dice Tech Salary Survey了解到,大数据项目的两个支柱(Hadoop及NoSQL)人才的价值高于其它任

李娜败给小威 大数据解析带你深入分析

李娜是我国有名的世界级网球运动员,为国家和个人争得了很多荣誉.但关注网球比赛的人一定不会忘记13年那场中国网球选手李娜与美国选手小威廉姆斯的那场美国网球公开赛女单半决赛.比赛中,虽然李娜一度挽救了6个赛点,最终仍然以0-6.3-6的成绩败给小威廉姆斯,遗憾止步四强.无论是否是球迷,我们都不禁要问一个问题:李娜为什么会输,是否真的技不如人,如果不是,她到底输在了哪儿? 很多人在赛后认为,李娜出局是因为出现了过多的失误,也有人认为李娜在比赛中的心态出现了问题--.原因可能有很多,但大数据分析会告诉网

QQ音乐2013来贺岁 全新“发现”引爆大数据时代

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 经历了2012的末日恐慌,2013以满怀"重生"喜悦的姿态到来,一时间"贺岁"成为了热门话题.1月29日,QQ音乐正式推出了针对全员开放2013贺岁版(http://y.qq.com/y/static/down/down_2013.html?ADTAG=outer.1).新版QQ音乐在框架结构和功能板块

2013数字营销趋势十点展望 大数据成核心

数字营销杂志3月25日报道 数字营销的核心是精准与互动,关键是提供可以衡量的营销效果,提升广告主市场营销的投资回报(ROI).大数据与大主意的结合将显著提升精准性与互动性,给广告主带来可衡量的营销效果与效率的几大提升. 1. 大数据+大主意:数字营销的核心是精准与互动,关键是提供可以衡量的营销效果,提升广告主市场营销的投资回报(ROI).大数据与大主意的结合将显著提升精准性与互动性,给广告主带来可衡量的营销效果与效率的几大提升. 2. 洞察的价值(Insight):大主意的本质是洞察力和创意力.

科技公司2013年IPO猜想 云计算和大数据成热门

北京时间1月8日消息,据国外媒体报道, 美国网站MarketWatch今天刊登了署名为特瑞瑟·波利蒂(Therese Poletti)的文章.波利蒂在文章中称,2013年美国科技公司的IPO(首次公开募股)至今仍是一个谜团,而且似乎存在一种趋势,即社交媒体公司的IPO将衰落,与之相反的是,云计算公司和大数据公司的IPO可能将会兴起. MarketWatch的文章内容如下: 2012年之初,投资者们都急切地期盼大量的科技公司进行IPO,特别是以Facebook为主导的公司.最终,Facebook的

2013年美国创业趋势:大数据崛起

如此重要的技术,却起了这么可爱的一个名字--Big Data.大数据能够处理企业无法储存的庞大信息,它们的体积庞大到一般企业连储存都做不到,更不要提分析了. 据IBM统计,世界上每天产生的数据量达到250万字节再乘以三次方,足够填满5.31亿张DVD光盘.在世界上所有的信息数据中,90%产生于过去两年.IBM大数据处理软件集团市场营销总监Graeme Noseworthy表示:"很长时间以来,我们专注于以人力资源为依托的业务生意,而现在逐渐向以数据驱动的组织架构转变,这种形式将让我们以客户为中心