5月23日—5月25日,2012第四届中国云计算大会云基地专场拉开帷幕,展示云实践、探讨云趋势,共享云未来。云基地专场全面展示了云计算领域的最新技术和新产品,并以论坛形式探讨云计算发展趋势、大数据的大价值、云时代数据中心的节能等备受业界关注的热点话题。天云科技副总裁雷涛表示目前大数据落地的应用方式有三种。第一个本身就是数据服务,数据服务更多的是提供一些资源服务,以及一些传统的数据能力的服务,比如数据的保存,长期数据的保存,还有面向大企业的一些专业维护,容灾的能力。第二块更多是信息的,这块采用了很多云机损的一些核心技术的变化,比如对传统数据的保存,原有的方式,文件系统也好,块数据也好,是没有检索的,我们在云计算里通过一些新的数据封装方式可以实现长期的保存。第三知识服务,一个个给大家介绍一下。从数据到信息到知识,Big DATA所起到的一些内容。
天云科技副总裁雷涛 雷涛:今天下午的主题是云计算里很关键的两项,从云平台一直到大数据,基本上从云计算里走过来的很大的两个关键历程,大家知道2011年底的时候,华尔街时报评了后PC时代的四大巨头来表示现在云产业时代的内容,亚马逊、
Facebook、谷歌和
Apple,每家都有自己的形象和特点,亚马逊是一家卖书的
互联网公司,它覆盖了每一个使用,把存量的IT资产包装出来,作为服务提交的形式,亚马逊也是云最主要的比较明确的云的形态出现。另外两家Facebook、谷歌不是卖资源,卖的是能力,卖的是它对数据本身的处理和分析,最终把价值
体现出来。就像Facebook和Google更多的是我们今天探讨的第二个能力,大数据上需要掌握那些内容。Apple更多的看的是IT消费化,也是2011年比较热的一个题目,使整个市场的饼扩大了,服务IT的最终这项从传统的企业端,买得起文件服务器、邮件服务器的高端企业也扩展到我们SMB的市场,扩展到每一个个体的消费者,通过随时可用可
获取的智能终端网络,今天下午的题目会花两个多小时的时间给大家分享这四个巨头里的前三种类型,云平台和大数据。
我们先从大数据开始,讨论Big DATA的时候会讨论什么内容?多数情况大家都在看什么?这个市场是不是够热了,从去年麦肯锡发布的第一个重大的倡议,150页的大数据的Paper,到今年美国政府采纳这个调研报告,把将近400多亿美金投资在了大数据上,它已经走过了从市场到落地的过程。
我们在市场中更多的听到Big DATA是什么?还是Technology本身,越来越多的平台级厂商给大家做了很多的宣讲,也就是工具层面。实际上我们今天要谈的,要跨越这几个,我们要谈的不光是产品与技术,更多的是要看Big DATA到底驱动了哪一块业务,它把一个从IT作为一个支撑角色演变成IT作为一个业务创新的驱动能力,这块是我们希望跟大家在后面的一个多小时分享的。所以,我们会从业务形态的模式,以及数据价值本身去跟大家做更多分享。
这些数字,35.2ZB,这个数字背后意味着什么呢?意味着更大的市场,更大的饼等待所有IT的从业者去挖掘和探索。这个数据本身我不讲更多了,通过这个DATA本身我给大家描述一下这个市场。
这个市场有百亿以上美金的投资,这个市场跟传统的BI,很
多人谈Big DATA就说是不是你们做基于数据的分析,这个跟传统的体系有一个很大的差异,BI跟Big DATA的差异在哪里呢?我们拿Google上的一个数据可以看到,下面黄色、粉色和蓝色的线就是BI,它基本上是在这个市场上没有太多变化,也没有吸引太多投资者和技术的追捧者,相反看Big DATA从2005年开始持续受到市场的关注,因为它的技术架构和解决的问题上跟BI有着非常显著的差异,这个差异在哪里呢?我相信今天一个小时之内可能解释不清楚,我们外面有一个售书,解答本身对于数据的价值怎么体现在生产生活之中。
很多新的Big DATA Winner而都在区分BI和Big DATA,无论是从技术层面还是数据价值层面,这两者的差异性都是非常大的。厂商也是非常热衷于在此投资的,从资本界到现在,从2005年至今可以看到,大手笔的投资在这个领域里,IBM、EMC、都是花了超过一百亿美金投资于这个领域。
我也分享一个今年2月份华尔街时报的一个报告,它描述了一个未来企业的核心竞争力,我们现在谈的都是从市场的角度看这个市场为什么会如此之热,这个报告里讲了一个核心的概念,什么是企业的核心价值资产,这里面列了IT结构的层次性,从底下的基础设施,到私有的IT架构,服务器,数据中心,到企业的应用,以及Analytics。我们分析这些年最挣钱的软件,这个报告阐述了一个观点,它关注于在后线市场,back office,更多的关注在交易性,关注在流程本身,也就是我怎么做更好的IT支撑,能够让这个工作更为高效敏捷。
当你达到一定的绩优以后,我这个物件到什么切入点最合理的使用,当所有的效率都达到最高的时候,你的核心的竞争能力在哪里呢?这个描述的就是数据本身,这个企业的数据将会成为你区别于其他企业的一个核心的能力,它不会成为下一层资产里的一些大路货。基础设施我们也可以跟运营商高端的企业打高蹈,卖服务器已经是很低的产品了,什么东西是你在企业里能够奠定自己有核心价值的内容呢?就是数据。
传统的企业需要一个转型,back office转向更前线,前线指的是市场,怎么通过你的IT能力引导你的业务,这是未来软件企业的核心价值。
刚才提到市场,七十从技术架构我们也看到一个很大的挑战,这里面分析了一个传统的业务架构,比如用J2EE、database,Web可以横向扩展,J2EE。
分布式计算在技术架构上解决了一个什么问题?我们不太多的谈技术本身,我们从宏观概念上给大家做一个解答,之前我们看SOA的时候,为了保证某一个业务能够很好的SOA的请求能够返回,我是让我的应用越做越大,
但是应用要处理数据,我要不断的输入和吞吐,IO对我就是一个很大的瓶颈,分布式计算的很大的理念就是我不再调入数据,数据分布式的放在该放的结构上,调度的是应用,把一个应用切分成上百份、上千份满足计算,数据是一个对立的设计概念,有了这种方式以后可以实现更多的面向数据敏感型的业务操作。
这种架构带来一个什么
好处呢?给大家分享一下Facebook的应用,我可以在意秒一级我的好友可以看到,它支持每天200亿处理,每秒是20万次的点击处理,整个全部是小于30秒的延迟,30秒是从客户端生成,在后端实施处理,然后动态的其他一些服务,整个服务是8.2亿用户的情况下使用。这个架构客观的讲,我们可以看到,拿传统的理念套用的话,Stream data processing类似于J2EE。
(责任编辑:蒙遗善)