6月4日,在第七届中国云计算大会上,数梦工场总裁王巍介绍说,数梦工场的数就是大数据,数梦工厂在大数据的基础上实现云架构;梦就是中国梦,数梦工厂解读中国梦为青山绿水、人民幸福、政治安定和经济繁荣;第三,数梦工场的员工绝大多数都是工程师,用数据技术来助力中国梦的实现。并且数梦工场秉承三个关键词,基于飞天、面向政企和场景化的开发和服务。
以下为采访实录:
记者:大家好!欢迎收看本期的视频节目。我们今天仍然是在第七届中国云计算大会的现场。坐在我左手边的嘉宾是数梦工场的总裁王巍先生,可能大家对数梦工场这个品牌还不是很熟悉,我想首先请王总给我们做一个简单的介绍。
王巍:好的,数梦工场是在杭州西湖区的云溪小镇,名字就把我们要做的事情基本概括了,数就是大数据,我们是在数据基础的这个基础上来实现一些价值。第二个是中国梦的梦,中国梦我们把它解读为青山绿水、民生幸福、政治安定和经济繁荣,数据技术可以在这些领域多做一些助力工作。第三个是工程师,我们绝大多数人都是工程师,研发工程师占了65%,其他基本也都是售前、售后的一些工程师,这些工程师要用数据技术来助力中国梦的实现。场就是一个创新的战场,也可以叫创新梦场。内部来讲的话,我们内部很放养的,是一种尊重个人和小团队创新的这样一个环境,但是外部的话,其实整个创业也是一个战场。我们实际上是用DT技术,就是用数据技术来圆相应的一些梦想。
我们有三个关键词,第一个关键词是基于飞天。数梦工场跟阿里云是在4月份签定了使命级战略合作伙伴关系。我们现在飞天作为自己的核心云的平台来做事情。第二个,面向政企,不是传统的消费类的,也不是传统的电子商务类的,而是面向政企各行各业,因为所谓的“互联网+”就是拿互联网的一些核心能力输出出去,到百行百业来做各个行业的基础设施和创新工具,我们选择就是政企的百行百业。第三个是场景化的开发和服务,场景化的开发服务,云是作为一种资源、一种能力,但是它不是直接产生总体价值,如果要产生总体价值,必须要把应用的一些能力,必须要把一些服务的人力,必须要把基础设施所涉及到的一些投入的财力,必须把数据整合所需要的一些权利做场景化的一些整合性开发和服务。基于飞天,面向政企,做场景化的整合式的开发和服务就是我们的一个定位。
主持人:那是不是可以这么理解,我们的公司是不是没有自有的一个传统意义上的专属的自己的IT基础设施,我们的基础设施其实都是基于云的,也就是说基于阿里的这样一个飞天系统?
王巍:可以这样去理解,因为这个稍稍有一点抽象,因为原来要么是一个设备厂商,要么是一个运营厂商,但是在DT时代,它最缺的往往不是已有的,因为厂商已经很多了,不是构建级的厂商,运营商也蛮多,也不是启发这种运营商,而是缺乏一种场景化的创新。举一个例子,一个省级政务云,它是需要一种环境的,这个环境,你比如像浙江省,他是没有买任何一个设备,也没有建任何一个机房,就拥有了全世界最先进的云和大数据能力。它这种云和大数据能力是什么呢?是中国电信提供的这样一个环境,这种环境是专门给省级政务云去用的,它也区别于以前的公有云,可以把它理解成叫专有云,就是专门给它去用的。这个云里面运转的是飞天平台,这个需要基础设施的飞天平台给它架构好,上面我要跑什么?比如要跑政务淘宝,政务淘宝就是把传统的政务的运作像淘宝店一样的,4000多个机构我们把它像淘宝店一样的,把政务的公共服务产品像商品一样,在上面来进行运行。这里面还要进行相应严格的安全的管控,实现数据集中和安全的一次平衡,还要进行必要的一些数据库整改,把原来异构的数据库同构到飞天上的IDS和DIDS上。大家可以看,在整个的过程,它不是一个简单的交钥匙过程,把相应的一些产品集成到那里就可以了,这里面有大量的平台的优化、管控、调优、增值,有大量的工作,这种服务我们用一个词把它抽象,叫BAAS,是一种后台去服务的这样一种提供。我们需要有一个专门的工程师队伍提供全站式能力和零距离的服务,这个就是我所提的,确实场地不是我的,是中国电信的,飞天的操作系统是阿里的,服务器是华为的,或者浪潮的,应用可能是蓝鲸大汉的,或者是其他软件开发商的,但是我们在这里面整个管控平台、整个BAS,整个架构设计,其实这一份工作量是整合创新里面还是比较重的这一块。
记者:从你刚才说的描述中,我想能不能跟我们具体地来说一下你的业务的堆栈都包括哪些层面的东西?比如说我们刚才也谈到了基础设施或者说云平台的管理这一块,可能不是你们自己的,你们跟别人来合作,那你们自己的这种产品技术堆栈都体现在哪些层次上?
王巍:好的,我跟大家说一下,底层是风火水电、机房环境,这是中国电信的,上面一层就是网络和服务器,就这两类设备,蛮简洁的。
记者:对,这叫IT基础设施。
王巍:华为的、浪潮的都可以这一层。再上面一层是什么?是三个最核心的构建,一个是弹性计算,这是阿里的。还一个是分布式数据库,也是阿里的,都是飞天的构建。还有一个是大数据,像ODPS这也是阿里的。面向政府的话,政府的应用要申请资源,要进行管控,要进行相应的一些安全计费,这个上面要有一个管控平台,管控平台我来开发的。再上面具体的还有支撑政府的数据的一种合并和开发,涉及到大数据分析这一侧,我们基于ODPS,要形成服务数据目录,要把它进行归并,要设置各种策略,最终形成可用数据,支持万众创新,这个你可以理解成一种服务,也涉及到一定的开发。政务淘宝对接也要形成一个中间键平台,也要进行开发,然后把这些应用都支撑好,最后形成一个完整的政务云的服务界面。所以我这样来表达吧,就是说底层的环境层、设备层和平台层实际上是做了三层的水平整合,在上面具体一些应用,要做应用整合,要开发一个管控平台,管控平台是让我们去做的,要做大量的服务工作,所以我叫场景化的开发和服务,主要是产生这两类的服务价值。有的时候是要把它集成为产品的,就像今天推出一体机,一体机是什么呢?一体机就是说我把所有的这些分层的东西,把它进行纵向整合,直接把它调优成最佳的效率,比如数据库一体机,能够把所有的异构数据库搬迁同构到这儿来,大数据一体机,所有的ODPS跟硬件给它调优,在政府的具体场景里边。因为我可以这样讲,其实长远来讲,可以看得出来,数梦工场管控平台,包括其他的,是偏行业PaaS层,因为PaaS并没有一个标准的PaaS适用于百行百业。其实不同行业因为数据都不同,需要服务的模式也不同,算法也不同,其实大的行业都会有自己相对应的场景化的PaaS平台。那我之前有一句话,就是说数梦工场我不会做别人已经做得很好的事情,别人已经把服务器做得很好了,交换机做得很好了,连机房线路都搞得很好了,飞天的基本管控的操作活动搞好了,这个不要做了。我就说为什么我觉得当前其实云计算、互联网+的过程当中面临的最大困难到底是什么?就是这些技术整合完之后,能在具体行业产生真正价值,而这个真正价值是依赖于一个PaaS分平台和相应的一些应用整合和管控的,我们就做这些工作,包括必要的这些服务工作。
记者:所以说你刚才也谈到,你说你不做那些别人已经做得挺好的东西了,但是乍一听,一体机好像也是很多厂商都在做的,所以我们的一体机到底跟别的厂商的一体机到底有哪些具体的不同呢?
王巍:一体机这个概念是很宽泛的,一体机比如说把安全的能力分装在一起,也叫一体机,叫安全一体机,有的把具体的某一类应用就分装在一起,ERP的应用都分装在一起,也叫一个一体机,有的只是数据库一体机。实际上一体机是按照应用场景和它的功能去区分的话,是有很多很多门类的。奥睿科也有一体机,SAP也有一体机,华为也有一体机,惠普也有一体机,都有一体机,我们跟别人的不同的是什么呢?比如数据库一体机,数据库一体机的话,我们用的是阿里的RDS和DRDS。这个一体机的话可以讲它的主要特点是什么呢?第一,如果你用的是分布式的海量数据库,它是一种分布式数据库,它的能力是很强的。因为今天会上我也在讲,既然阿里也不是因为光成倍原因要去奥睿科,而是因为奥睿科在支持它各种库的时候,因为太大了嘛,太大了以后的话,其实奥睿科的能力上限达不到海量数据库应用的下限,所以它要替代。成倍原因也是其中的一个原因之一,所以有一类市场它就像按凯普(音)理论的话,如果你确实对一致性和可用性要求极高的情况下,高频交易,然后又做了大量的存储过程等等,那我是觉得用奥睿科蛮好的。但是有一些可能他对可用性和可扩展性要求特别高的时候,这个时候分布式数据库是最好的。这个时候它的优势就发挥出来了。
所以这个一体机我可以这样讲,阿里是基于自己前台应用的实践,无论是支持淘宝,还是支持支付宝,它有一个很优秀的分布式数据库,把它分装起来,为什么分装起来的话,一体机要做大量的软件和硬件调优,分装出来的话,用到某一类,实际上要做某一类的一些调优工作,硬件参数很多,软件参数也很多,调优完了以后,这一类普遍地去推送,其实这个就是一种产品形态。但是你看的话,你会发现我用的是华为的服务器、浪潮的服务器,计费肯定也不是我自己做的,软件,这里面的功夫还是在于场景化的调优和增值,也会开发10%左右的相对应场景的门户管控类的,也会做相应的开发。
记者:这又回到您刚才谈到的业务模式,又有点比较好奇的一点,比如说您刚才谈到浙江政府,他自己也没有采购任何的机房设备,没有采购任何的IT基础设施,都是通过一种云、大数据的服务来获得相应的能力,如果你以后也是这种一体机了,开始以这种感觉像一种卖设备的套路来做,按你刚才的那种商业模式的话,又会是怎么样一个具体情景?
王巍:这个我跟你解释一下,因为很多时候大家把公有云和私有云,把它很对立,非此即彼,其实它们都是云,云是什么?是一种超级计算能力,是一种公共计算服务能力,这里面这种计算服务能力它的对象,它的对象可以是全世界人民,也可以是这个地球上的局部人。之所以这样的话,一方面是因为安全的原因,也有一些云的集中性和网络的局限性,也有一丝博弈。所以我可以讲,如果谁买票都可以上的,这其实就是公共汽车,但是只有公安才能上的那是公安的班车,因为我们不能说有公共汽车了,可能某些行业就不能有班车。这个里面是要达到什么呢?达到安全与数据集中的一次平衡,也达到效率和集约性的一次平衡。所以一体机我可以这样讲,一体机并不是说这个资产就一定要归属,因为现在还有大量的像PPP的建设模式,资产可能归于投资者,它只是被租用的。政府的话,因为他最在乎的是什么?我们反复地去跟政府客户聊,你真的在乎拥有一个固定资产吗?重资产部分你真的在乎吗?还是最后你在乎的是数据资产?以及数据资产所产生的这么一个价值,那OK,其他东西都可以不拥有、去租,但是有一个数据一定是有一些部门一定要牢牢把握在自己手里。还有一个,我可以讲,就目前来讲,数据的资产是没有严格的法律依据的,比如你去做个CT,你的数据到底是你的还是医院的?搞不清楚,有很多搞不清楚的时候,真的有些数据你掌握了,就像有一些零售类,掌握了我们的用户名、手机号和我们的麦克地址,你就可以交易吗?对吧?所有的快递,快递数据可以交易吗?如果快递公司想把我们的数据交易出去,可以吗?我是觉得直觉是不可以的。所以我是觉得这里面有大量的安全管控,大量的一些界限,它并不是在线,真的在的互联网所有人都能看到这个线,还是一个很严肃的事情,这个世界我认为百分之六七十以上的价值数据是暂时不能在线到所有全人类的范围内,可能只能在线到特定企业和特定行业这个范围内。所以部分地方,你要非得说它是一个私有云或专有云,也行吧,它也是一种公共服务,不矛盾。
记者:您刚才也谈到数据库,感觉阿里一直在强调去IOE,好像你们也是一个去O的一个主要的推手,可以这么理解吗?
王巍:我认为是这样的,我自己是做DB2出身的,对奥睿科也有一些了解,我觉得很多技术是蛮优秀的,但是任何一个技术,我搞这么多年的话,我知道,任何一个技术并不是所有的场合都是性价比最优的。所以我不喜欢“去”这个词,这个世界上谁去谁呀?实际上我喜欢可能有时候弱一下,有些不必要去用的,第一种不必要,可能性价比不是最优的,是用户选择替代一次。还有一个可能这种数据库架构在能力上,可能在互联网场景里面,在互联网+过程当中,能力不匹配,那就不是替代,是取代,它已经做得很好了,又不涉及到一些安全的问题,那就接着去做,干吗,我没想一定要去人家。
记者:所以结合场景来做。
王巍:还是结合场景来做,我觉得最终做决定的是客户,我们只是跟客户去解释一下,现在我们所推出来的这个产品,它到底是具备什么样一个能力,得用户去做选择。
记者:最后一个问题,还是想结合您公司本身,您刚才也谈到了,一直在做一种场景化的服务。能不能给我们举个例子,比如说你的实际的案例,去比较鲜明地体现出你这种场景化。比如说你现在能拿出几个比较典型的应用场景或者政企,或者说这种企业的应用场景,或者说在实际案例中有哪些场景发挥的作用,带给了客户哪些价值?大概也给我们说一下。
王巍:你比如说在政务应用当中的话,它有的时候就涉及到什么呢?涉及到了效率问题,比如要迁到云上,迁到云上之后的话,数据库要去异构,要同构,这个时候你所有的应用过来,它的整个CQ1G的效率实际上不一定是最高的。我曾经举过一个例子,有一个地方大型网站压力很大,用工程师调优两天,整个性能提高4倍。但意味着什么?那个网站是花两三亿建的,提高4倍就意味着这些工程师几天之内是创造了八九亿的性价值,我是觉得这实际上是一种场景化服务。就是一些应用过来,因为应用开发商有很多嘛,对于这个环境怎么样能把效率提到最高,比如CQ1G的调优,第二个,天天涉及到安全问题,安全问题是个动态的问题,怎么样能够把最新的防攻击手段,最新的防漏手段,不断地去给它做加固。第三个,可能人家的原代码都没有一个很好的管理机制,能不能给人家提供一种原码的管理服务。第四个,能不能帮助人家去做新的大数据的一些算法支撑和一些辅助工作。因为现在可以讲大数据对于很多单位来讲是很新鲜的,所以你会发现,我自己总结是什么呢?整个过程交不了钥匙,它是不停地在做咨询、建设、维护、调优、增值,这五个动作不停地循环着在做。这整个一个过程,我之所以叫场景化的开发和服务,是需要一批专家在这种重要场景里边长期的驻扎的,长期地去服务的,这跟以前卖了产品可以基本上离场是不同的。
记者:好,非常感谢王总今天能接受我们的采访。其实感觉您刚才说的最后总结的那五点循环,好像感觉这个梦一直要做下去,跟以前的《盗梦空间》我要做几层的梦的感觉一样。但是我觉得有这个梦总比没有这个梦要好一些。再次祝愿我们的数梦工场能在王总的带领下,能让更多人实现他们的数据的梦想。谢谢王总。
原文发布时间为:2015年7月6日