十面「霾」伏下的大数据预言

  大数据时代下的气象服务是什么样子?在看得见的未来,融入地理信息、社会经济等多维度数据,能够让人们知道下一刻哪里可能会发生什么,比如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨堵车。

  即将过去的2013年,“雾霾”几乎成为许多都市人最扰心的一个热词。在北京,政府甚至不得不以工地停工、公车停驶、工厂停产等种种措施,尽力减少各种污染物的排放。

  十面“霾”伏的敌人来自何方?大数据时代的到来或许可以寻根溯源,因为它能帮助人们更准确地了解、判断生存环境中最重要的一面—空气质量。

  未来大数据的价值核心在于预测。中科大信息科学技术学院院长李卫平介绍,中科大先进技术研究院中正在进行着一项科研,通过收集和分析雾霾天气产生的各种数据,找到产生雾霾天气最主要的原因。“这是一些看上去杂乱无章的数据,我们建立一个大数据库,从中找寻规律性的东西。”这个科研项目与微软合作,一旦找到其中规律,有望为政府治理雾霾天气提供科学依据。

  2013年10月30日,在微软亚洲研究院创新日上透露的一种新技术,试图让人们了解所在地区空气质量的真实情况。在此基础上,人们就能做出更明智且更有利于健康的决策,例如何时何地最适合户外运动,或者何时应戴上口罩或关上窗户。

  “这些工作都是在大数据的基础上才能够进行,无论模式如何先进,没有海量的数据进入,都不能达到很好的效果。”中国气象局公共气象服务中心高级工程师唐千红说。

  在大数据时代,数据并非单纯指人们在互联网上发布的信息。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、温度、湿度乃至空气中化学物质的变化。

  微软根据现有监测站所提供的空气质量数据以及城市里的其他多种数据来源(包括气象情况、交通流量、人员流动趋向、路网结构、人口集中点等),运用数据挖掘和机器学习技术,对大数据加以充分利用,并在监测信息和对应结果之间建立一个隐式映射,从而可以实时推断出包含细颗粒物信息的城市空气质量数据。

  大数据时代下的气象服务是什么样子?唐千红认为,在看得见的未来,融入了地理信息、社会经济数据的气象服务,能够让人们知道任意时间地点可能会发生什么,例如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨、会不会发生山洪。

  其实大数据就在脚下,尽管很多时候我们没有意识到。

  全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化。事实上,从城市交通到空气质量,从建筑设计到影视制作,大数据分析应用已经渗透到生活的方方面面。大数据到底怎样改变了人们的生活轨迹?为此我们采访了微软研究院院长Peter Lee、微软亚洲研究院院长洪小文、微软全球资深副总裁周以真,揭开大数据的神秘面纱。

  数字商业时代:什么是大数据与机器学习?这一技术的商业应用前景如何?

  洪小文:我常常举一个例子,譬如说你妈妈明天要来北京看你,她在邮件里告诉你航班的号码,明天下午5点钟会到。可是你那天下午在开会,三四点的时候计算机就自动把邮件里面的航班号码抽出来,自己去航空公司的网站一查,告诉你班机晚点,要7点才来。而且它还会根据交通状况决定什么时候通知你出发,以什么方式出发。它可以建议你坐出租车、坐地铁要多少分钟,甚至可以在你的社交网络里找到附近的朋友开车来载你。

  这些自动化都可以做得到,但是今天还没有这样的系统和服务,所以就只能隔几分钟看一看,很浪费时间,而且在很多场合不允许。这样的东西其实是大数据与机器学习的表征,需要很多不同种类的数据,有邮件的数据、地图的数据、飞机的数据、交通的数据。大数据不仅是大,还要有多样性和集成性。

  大数据还应用在其他方面,比如报刊杂志上的文章到底有多少人看,大家有什么评价,转发给谁。以前这些东西可能要做问卷才能得到,今天通过互联网更有机会获取。如果搜集的大数据都是零散的、繁杂的,你怎么去看?这就需要数据可视化,这一点对管理者非常重要。管理者在做一个决定之前,想看看这个东西在某一个区域大家的反应会怎么样,调出来一看就知道。

  大数据与机器学习真的是在每一个行业都有类似的应用。

  数字商业时代:有人说,大数据与云计算是一个问题的两面,云计算是支撑大数据时代的基础。但当大数据和云计算真正落地,或是走向消费者的过程中遇到的障碍和挑战有哪些?

  周以真:实际上,普通用户已经享受到很多大数据和云计算所带来的利益和好处,只是我们并没有清晰地意识到而已。比如用Windows Phone进行文字输入,输入前一个字,就会有下一个字或词汇的提示联想。或者用手机或PC收发邮件时,垃圾邮件的过滤功能。这些都是集成大数据和机器学习的技术才能得以实现。

  类似的应用无处不在,甚至可能存在的地方太多了,我们都已经忽略它了。

  另外一个典型的例子是关于云。比如我们把手机上的照片存储在云端,即使手机丢失再换一个新的,你仍可以从云上重新把照片下载下来。

  数字商业时代:可穿戴设备就像“人体的物联网”,通过传感技术可以检测出用户的体温、血压、心率等数据,这些个人的身体数据库非常有价值。那么微软未来在可穿戴设备这一块最大的机会是在哪儿,是在硬件设备,是在云端,还是在软件上?

  Peter Lee:这三个领域都有,但是我最感到振奋的就是云端。之所以说是云端,是因为云计算的环境当中有大量的数据、大量的计算能力,再加上机器学习的功能,可以展示出非常高级智能的产品。比如说从云端可以看到你过去一年运动量够不够,判断你所吃的食物是否足够健康,还可以把信息反馈给你的医生。这些都需要有非常好的云架构。

时间: 2024-09-21 22:30:52

十面「霾」伏下的大数据预言的相关文章

支付宝「占领」全球,看大数据时代下的人民购物

现如今,如果提起支付宝,那可是无人不知,无人不晓.支付宝时代,让整个社会变成了无现金社会.无论是我们出去聚餐,还是出去购买,一个手机在手,就像拥有了全世界,方便,快捷. 既然支付宝如此的方便,那它对于中国的改变,是不是更具有历史性的意义呢?这句话毫无疑问.而当你以为支付宝就这点影响了的时候,它通过"占领"全球,让各个国家的人,也开始感叹中国的发展. 支付宝进入日本赚足眼球 据悉,日本机场已有超过90%以上的店铺都能使用支付宝,还有百货.免税店.出租车等.而就在前不久,日本的肯德基也相继

NVIDIA 深度学习部门总监 Jim McHugh :AI 驱动下的大数据之路已铺好

编者按:无论是打败世界冠军的 AlphaGo,还是百度无人驾驶.阿里和腾讯的人工智能都在使用 NVIDIA 的芯片组,它在人工智能领域扮演着大脑的角色.无论软件公司研究出多么先进的算法,最终都需要处理器来进行运算,没有它们的支持,人工智能的良性发展也就无从谈起. 最近,NVIDIA 深度学习部门总经理 Jim McHugh 接受了国外媒体 InsideBigdata 的访谈.从他在 2016 年纽约 Strata + Hadoop World 大会上的发言开始谈起,Jim 讲述了他对 AI 驱动

十八款Hadoop工具帮你驯服大数据作业

文章讲的是十八款Hadoop工具帮你驯服大数据作业,Hadoop已经通过自身的蓬勃发展证明,它不仅仅是一套用于将工作内容传播到计算机群组当中的小型堆栈--不,这与它的潜能相比简直微不足道.这套核心的价值已经被广泛证实,目前大量项目如雨后春笋般围绕它建立起来.有些项目负责数据管理.有些负责流程监控.还有一些则提供先进的数据存储机制. Hadoop业界正在迅速发展,从业企业拿出的解决方案也多种多样,其中包括提供技术支持.在托管集群中提供按时租用服务.为这套开源核心开发先进的功能强化或者将自有工具添加

电视台成阿里云下一个大数据重塑目标

本文讲的是电视台成阿里云下一个大数据重塑目标[IT168专稿]继空调之后,电视台成为阿里云计算的下一个大数据重塑目标.3月20日下午,阿里云宣布联手新奥特.华通云数据,打造中国最大的全媒体云计算平台.该平台可以在一周内,帮助传统电视台变成多屏网络电视台,支持电脑网站.手机APP.电视机全终端流畅播放,且可以实现大数据的收集整理和运营.今年内,全国两百家电视台将接入该云计算平台. 阿里云是中国唯一可以将5000台计算机合成一台"超级计算机"的云计算平台,将为全国广播电视媒体提供超级计算.

决胜对话百家名校 互联网教育下的大数据创新

2014年12月1日-3日,中国国际智慧教育展览会将在北京鸟巢•国家会议中心拉开序幕,展览会汇聚了218家教育信息化领域尖端企业,已有万余名横跨政.企.院校人士报名参观,一场教育信息化盛宴即将上演! 教育信息化是现代教育的本质特征之一,是社会信息化浪潮的重要组成部分.如何利用现代信息化技术提高国家教育质量,如何利用高度发达的现代网络实现校园教育跨越式发展,开始受到越来越多的关注与讨论. 以终端用户角度展示校园信息化的"首届中国智慧教育成果巡礼"活动,集合了来自清华大学等全国20所普教.

企业互联网时代下的大数据构建之道

文章讲的是企业互联网时代下的大数据构建之道,"现在企业互联网化正在迅速渗透到企业以及所处的产业链和生态圈中,借助互联网,企业可以更容易与前端供应商.服务商包括后端客户.最终客户建立密切的联系.在此过程中新的业务模式包括供应链优化.智能制造.产业链协同.电子商务等正在不断兴起并迅速发展." 用友网络科技股份有限公司助理总裁,兼集团iUAP中心副总经理谢东在接受记者采访时说道. 企业互联网化 大数据成为核心资产 企业互联网化已经成为一种趋势,它正在改变着企业的传统的业务模式,使得企业内部运

十大技术,十家机构,从行业制高点一览大数据

大数据在各行各业中取得了迅猛发展,许多组织都被迫寻找新的创造性方法来管理和控制如此庞大的数据,当然这么做的目的不只是管理和控制数据,而是要分析和挖掘其中的价值,来促进业务的发展.着眼大数据,过去几年内产生了许多颠覆性技术,比如Hadoop.MongDB.Spark.Impala等,了解这些前沿技术还有助于你更好的把握大数据发展趋势.诚然,想了解一件事物,首先要了解与该事物有关的人.因此,要想了解大数据,光了解技术是远远不够的,本文中大数据领域的十个巨头,将有助于你更深入掌握大数据这个行业的发展形

阿里“神盾局”联合公安打击线下假货 大数据成最可靠情报

ZDNet至顶网软件频道消息:阿里巴巴近日披露了系列打假案件,都是近年来协助各地公安破获的查假货的案例.在阿里巴巴内部,有支神秘的部队被阿里人戏称为"神盾局",这就是阿里巴巴安全部,很多的假货最初都是被神盾局发现,然后根据大数据提取线索报给公安机关,最终促成破案的. 世界杯期间,他们就协助公安查获一家卖假球衣的店铺,阻止了3000多件假球衣从线下流入淘宝用户. 2014年5月,世界杯开赛前期,在阿里巴巴的淘宝指数统计平台上已经可以看到,世界杯球衣的搜索和成交持续升温.这中间会不会有假货

腾讯数十亿广告的秘密武器:利用大数据实时精准推荐

本文是福布斯中文网"数据大玩家"专栏中的一篇文章.接受提问的蒋杰先生,是腾讯数据平台部总经理,在加入腾讯前,他曾经是支付宝的数据经理.提问的车品觉先生,是中国信息协会大数据分会副会长. 在过去几年,你在腾讯做了什么来推动大数据的应用? 过去三年,我一直在坚持一件事:推动大数据的实时应用.现在从国外数据中心的数据,一秒钟可以达到深圳数据中心,这就是腾讯具备的数据能力.有了这个能力,就可以做很多商业化行为的模式. 目前腾讯收集的数据已经超过了1万亿条, 计算机规模已经超过了8千8百台.这么