大数据和云计算 是分不开的硬币正反面

1大数据和云计算硬币的正反面

“大 数据也需要云计算这个平台,这是一个硬币的正反面。”阿里云总裁王文彬(花名:菲青)与媒体交流时表示。这几年IT行业发生了翻天覆地的变化,直到现在大 家依然在谈论云计算。这云概念出现当初,业内不断传出质疑的声音,随着各大云服务厂商的努力,现在各行各业都已经开始接受了云计算服务。2014年7月, 阿里云ODPS项目正式对外开放。

伴随着互联网与移动互联网的相关技术不断成熟,云计算开始被市场接受,海量数据大潮来袭,厂商和企业纷纷看到了大数据的前景,我们现在已经生活在一个数据的时代。

传统IT已经被颠覆

阿 里云从2009年开始在云计算服务方面进行研究到目前已经有五个年头了,这五年中阿里云突破了各种各样的技术难题,从去年的5K集群到今年的ODPS,阿 里云已经成为云服务产业中的领军人物。在阿里云看来,云计算和大数据是不可分割的,就好比一个硬币的两面,精准的大数据分析依赖于强大的云计算平台。

阿 里云总裁王文彬表示:大数据和云时代的到来颠覆了企业传统IT架构,企业IT进入了云服务+数据的时代。传统IT还存在于购买硬件与软件的基础上,而云服 务将企业IT变为按需购买,从针对硬件与软件的购买模式上转变为对服务的统一购买。随着移动互联网加互联网的来临,整个模式现在是一个翻天覆地的改变。

2大数据带来的改变

大数据带来的改变

大 数据已经趋于平民化,花个几百块钱,人人都可以使用大数据服务,玩转大数据已经不再是大企业的专属技能了。经过五年的积累,阿里云计算发布核武器级别的大 数据产品——ODPS。通过ODPS在线服务,小公司与小团队可以对拥有的海量数据进行快速分析挖掘。阿里云总裁王文彬(菲青)表示,ODPS会改变整个 中国,不论云计算,或者整个大数据的里程碑,所以我们自己一直体会到这个东西。

到底什么是ODPS

简单来说,ODPS(Open Data Processing Service)是一项Web服务,大家不用花大钱建数据中心,就能分析海量数据。我们测过,100PB的数据任务可在6小时内跑完。这个数据量相当于1亿部高清电影。

如何让数据产生价值?先得拥有大规模处理能力,然后才是挖掘、算法和分析。传统的做法是这样的:租个机房,买一堆昂贵的设备搭建数据仓库,再请一帮技术人员来维护运转。一旦触发bug,或者当数据总量超过100TB时,你的工程师们可能会被这些麻烦搞崩溃。

Hadoop开源系统很伟大,大大降低了成本。阿里是中国玩Hadoop玩得最好的几家公司之一,Hadoop支撑了淘宝、支付宝早期业务的快速发展。不过,自建一个像样的Hadoop集群,得百万起步资金,专业的Hadoop人才更是稀缺。门槛还是太高。

ODPS到底能做些什么

在 国内,说得再好不如有个好的案例。ODPS已经在阿里内部进行了大量的使用与测试。在阿里内部,第一使用ODPS的是阿里小贷,阿里小贷每天得处理 30PB数据,包括店铺等级、收藏、评价等800亿个信息项,运算100多个数据模型,甚至得测评小企业主对假设情景的掩饰和撒谎程度。经过长期的测 试,ODPS帮助小贷完成了大量的数据计算与分析的工作,从而掌握正确的用户信誉度。

在未来,人们申请贷款的时候机器就可以完整个流程,根据大数据分析得出的个人信誉度来自动完成相关的信誉评估。

公共领域的数据挖掘,可以用ODPS吗?当然!结合中国气象局的精准预报数据,高德地图不 久后就能告诉你:"前方道路已严重积水,您的车辆驶入可能会遭水淹,建议绕道行驶。"如今,每盒药品上都有一张电子身份证,从生产、流通、储存、配送、销 售到使用,全过程的数据都跑在ODPS上,一旦发现问题药品,监管部门可以立即采取措施。我们期待未来每一桶油、每一道菜的数据都跑在ODPS上,食品安 全问题需要通过创新的方式来解决。

3探秘阿里云的御膳房与登月计划

探秘阿里云的“御膳房”

基于ODPS,阿里为第三方软件服务商和品牌商提供大数据计算、挖掘、存储的云环境开发平台,构建阿里数据生态。通过御膳房数据市场,数据消费者与数据提供者可以安全地交易、使用海量数据,实现数据价值。

1.丰富的淘宝数据。目前御膳房已开放商品、商家、客服绩效、品牌四大主题数据,后续会继续开放行业、竞品等主题数据;同时开发者也可以将个人数据上传使用。

2.指标标准可靠。开放共建的聚石塔数据标准联盟,御膳房提供完善准确的基础指标定义,计算口径,检验工具等,确保数据标准、唯一可靠。

3.自助计算。强大稳定的计算能力,提供离线分布式计算平台及强大的算法环境,自主提交计算任务,自主开发模型挖掘数据价值,大数据计算快速响应。

4.安全的操作平台。御膳房支持隔离的数据存储、独立的数据任务部署,确保御膳房内的数据交易与数据开发安全防泄漏。

5.灵活数据接口。开发者可根据需求灵活定制API,数据输出符合TOP API规范。

6.大数据挖掘工具。御膳房提供R、Python、MySQL在内的主流大数据挖掘工具,支持模型研究与快速迭代试验,提升数据价值。

阿里内部的登月计划

2013年10月,为了融合阿里小贷和支付宝的数据,支付宝希望ODPS团队协助他们搬家,将支付宝数仓业务从Hadoop机群搬到ODPS上,登月1号项目启动。2014年5月,登月1号项目顺利成功,小微金融服务的全部数据业务开始基于ODPS发展。

在 2013年底,受到登月1号项目的启发,阿里数据平台团队联合技术保障部和集团各事业部,开始了一系列宏大的登月计划,致力于将搜索、广告、物流等多个 BU的数据统一,未来ODPS将成为承载阿里集团全部数据的统一处理平台。“登月计划”共计划了20多个项目,涉及阿里巴巴和小微金服所有的事业部,覆盖 集团全部数据人员,其牵扯人员、资源之多,在集团内部罕见。

从Oracle到Hadoop,阿里云解决了海量数据如何存储和分析的问题,阿里的数据业务不再受制于规模的瓶颈;从Hadoop到ODPS,更是一次质的飞跃,为后续大数据业务的开展扫清了障碍。

时间: 2024-10-28 23:41:38

大数据和云计算 是分不开的硬币正反面的相关文章

大数据是云计算的“杀手级”应用

ZDNet至顶网服务器频道 03月06日 新闻消息:全国人大代表.腾讯公司CEO马化腾在今年两会议案中建议,加快移动互联网在民生领域的普及和应用,通过互联网解决防治雾霾等重大民生问题.全国政协委员.百度公司CEO李彦宏在今年提交给两会的提案建议,设立"中国大脑"计划,推动人工智能跨越发展,抢占新一轮科技革命制高点.这背后均涉及海量数据.如何确保数据流通畅无阻?这就离不开云计算这位幕后英雄了.围绕云计算跟普通用户的关系,在万物互联社会中云计算的重要作用,国务院新政将给云计算产业带来哪些利

大数据和云计算二者的区别

关于大数据和云计算的关系人们通常会有误解.而且也会把它们混起来说,分别做一句话直白解释就是:云计算就是硬件资源的虚拟化;大数据就是海量数据的高效处理. 虽然上面的一句话解释不是非常的贴切,但是可以帮助你简单的理解二者的区别.另外,如果做一个更形象的解释,云计算相当于我们的计算机和操作系统,将大量的硬件资源虚拟化之后再进行分配使用,在云计算领域目前的老大应该算是Amazon,可以说为云计算提供了商业化的标准,另外值得关注的还有VMware(其实从这一点可以帮助你理解云计算和虚拟化的关系),开源的云

智慧物流该怎么搞?大数据、云计算、4G各领风骚

不久前,商务部电子商务司副巡视员聂林海公开对菜鸟的发展路径提出了质疑.他说,菜鸟网络到处建物流基地建仓储,"因为经不住诱惑,地方政府太重视电子商务,给他非常便宜的地",菜鸟的路"走歪了".在日前举行的2014物流与采购信息化推进大会上,有关部门再次向与会企业和专家提出这样的问题:智慧物流究竟该怎么搞? "圈地派": 促进电商与物流融合发展 马云[微博]对智慧物流给出的答案是:首先得有地,以"万平方米"为单位的土地.在马云的设想

大数据和云计算时代的机遇

本文讲的是大数据和云计算时代的机遇,随着云时代的来临,大数据(Big data)也吸引了越来越多的关注.著云台的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱.大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十.数百或甚至数千的电脑分配工作. 马云卸任演讲说道:"这是一个变化的世界,我们谁都没想到我们今天可以聚在这里,可以继续畅想未来,我跟大

张亚勤:大数据是云计算杀手锏

微软亚太集团研发主席张亚勤近日向赛迪网记者表示,大数据是云计算时代的杀手锏应用,每个企业都应该把数据作为核心战略,有了数据才有未来. 张亚勤称,未来5年的竞争,是三大平台的竞争,三大平台分别为终端平台.http://www.aliyun.com/zixun/aggregation/13423.html">云计算平台以及云和端之间的平台;而云计算的兴起,让企业有了大数据的能力;大数据,是云计算时代的杀手锏应用. 张亚勤表示,大数据能够8084.html">蓬勃发展,主要有三个

地理信息技术需要与大数据、云计算等跨界融合

"当前,我国经济发展进入新常态,新一轮的科技革命.产业变革形成历史性的交汇,测绘地理信息事业也正处于大有作为的重要时机.信息化正引发各个领域生产模式.商业模式.管理模式的变革和创新,对经济社会发展和百姓生活各个方面都产生了重要影响."日前,国家测绘地理信息局副局长李维森在京召开的2017测绘地理信息高端论坛会上如是说. 国家测绘地理信息局国土测绘司副司长陈军在会上说,当前,大数据.云计算.物联网.移动互联.人工智能等新技术快速发展,迫切需要将地理信息技术和这些新技术跨界融合,取得更多的

硬币的两面:大数据和云计算

硬币的两面: 大数据和云计算 樊万鹏 重庆中兴软件有限责任公司总工程师 云计算与大数据是一枚硬币的两面,构成了http://www.aliyun.com/zixun/aggregation/8344.html">移动互联网时代最具技术前景的两翼. 2011年4月,在重庆两江新区水土高新技术产业园开建的国内最大的离岸数据处理中心(云计算中心)具备了大数据应用解决方案的载体.那么,大数据到底能给我们带来什么?我们来举个智慧交通的应用场景. 城市拥堵是政府和市民最头疼的一件事.基于云计算中心运行

物联网、大数据、云计算支撑智慧城市

"冰箱里还剩1个苹果,是否需要订购?"你的手机收到冰箱自动发来的短信.不用回复,根据提前的设定,冰箱将自动向网上商城下单,并提示你用手机在线支付. 5月21日,在河北联通智慧城市体验厅,工作人员尹芳向记者展示了智慧家电等未来智慧城市的应用. 我省石家庄.秦皇岛等6个设区市,已被列为首批国家智慧城市试点.截至目前,我省11个设区市政府都同互联网运营商签署了智慧城市战略合作协议. 感受智慧城市迫近的脚步,或许世界将为之改变."城市智慧化,变化润物而无声."河北联通产品运

EMC基辛格:大数据和云计算概念不同但有交集

"EMC正在处于转型期,从过去到未来,这种变化让EMC将是两家完全不同的企业,"EMC信息基础架构产品事业部总裁兼首席运营官帕特·基辛格一年后如约再次来到中国,"过去EMC只是一家存储厂商,而未来EMC将引领信息基础架构解决方案市场的发展,成为市场的领导厂商,而不再是一个跟随者." EMC信息基础架构产品事业部总裁兼首席运营官帕特·基辛格 EMC 2011年开局不凡,第一季度财报显示EMC Q1综合收入创纪录达到46亿美元,其中在在欧洲.中东和非洲地区.亚太地区和日