全球最大的 OpenStack 集群背后:中国移动的开源之旅

有句话叫“OpenStack一小步,中国开源一大步”,正是说明OpenStack在云计算未来发展的重要价值。作为一项启动于2010年的开源项目,OpenStack正凭借其开放先进的架构、高效的社区开发、灵活的部署模式,成为全球发展最快的云计算开源社区。

只不过与历史上很多开源技术不同,OpenStack不仅得到了草根和开发者的认可,也得到了一线IT厂商和明星用户们的青睐,正在成为云计算部署的事实行业标准。

在OpenStack的众多拥趸中,有一家企业非常引人瞩目,那就是全球最大的电信运营商—中国移动。它不仅构建了全球最大的OpenStack公有云/私有云生产环境;而且创建了很多独特的应用场景,验证和反哺了OpenStack的技术体系;同时,类似于中移动这样的超级用户的深度参与,也加速了OpenStack产业链的进一步成熟。

长久以来,以中国移动为代表的运营商们,一直行走在相对封闭的电信世界中。是什么原因促使他们走向了开源世界,他们眼中的开源世界又有何不同,又将会选择一条什么样的开源之路,带着这些问题,C114编辑对中移(苏州)软件技术有限公司副总经理孙少陵进行了专访

▎中移(苏州)软件技术有限公司副总经理 孙少陵

自研驱动:走向软件时代

据孙少陵介绍,作为中国移动研发体系改革的关键一环,集团公司三年前决定要在苏州成立研发中心(以下简称苏研),主要是从事云计算、大数据、IT支撑系统三个方面的研发工作。

与位于北京的,比较偏向于标准和前瞻性技术的中国移动研究院不同,苏研聚焦于做产品,去交付产品和解决方案,是中国移动内部产品开发的重要力量。

“按照集团公司的要求,我们积极在锻造自己自主开发的能力,并且在云计算、大数据以及IT支撑系统方面积累自己的优势产品,并且帮助公司战略转型。苏研两年发展迅速,到现在人数已经超过700人,研发人员占比超过85%。我们的愿景是成为国内一流、世界领先的IT服务商,在中国移动整个板块里,是希望能够帮助公司从原来传统的运营商,转变成一个真正在IT方面有核心能力并且能够提供IT服务的数据化服务商。”孙少陵说。

而要实现这个目标,自我研发能力是不可或缺的。而排在苏研的三项主要工作之首的,就是要向公司内部提供核心的软件产品,其次则是实现IT支撑系统与外部服务提供技术支撑,希望通过自己的技术能力去帮助中国移动在开发、运营方面实现能力进化。

孙少陵非常不认同业界关于运营商软件能力缺失的论断。“软件能力的问题,几乎是全世界所有运营商都面临的问题。我认为这个问题是在一定阶段,运营商所处的产业环境造成的,而不是运营商天然就不支持开发能力。”孙少陵说。“像Linux操作系统最早是从运营商的实验室里走出来的。当然后来因为很多产业政策,对于设备和运营的管制要求,客观造成了运营商在很长一段时间基本上是拿来主义,而行业标准组织的存在,设备商之间的产品可以非常完美的对接,运营商通过采购可以解决成本和互联互通的问题,没有必要去做开发。”

但现在情形已经完全不同,中国移动面临的竞争对手,不仅仅是原来的运营商,而是诸如腾讯、阿里这样的OTT。“在这种情况之下,运营商发现软件开发是我们的‘一碗饭’,这也是集团公司成立苏州、杭州两个研发中心的初衷,虽然在一些流程方面与互联网公司还是存在差异,但现在我们开发的东西可以迅速上线测试,如果发现任何问题或者需求反馈,也可以及时提交给开发人员,研发和运营一体化之后,软件成熟的路径会越来越畅通。所以,我们对于运营商未来的软件开发是有充分信心的。”

▎中国移动苏州研发中心

选择开源:要有勇气和决心

孙少陵说,中国移动在云计算方面起步非常早,可以说是产业早期的拓荒者。

“2007年,我们就开始做相关平台的研究工作,当时还没有云计算的概念,而是被称为大规模定制计算。因为我们已经意识到产业在转型,运营商原来集中式的单机架构已不适应未来技术的发展。软硬件一体化的ICT基础架构未来必然会被开放平台和软件定义所取代。”

在2009年,中国移动真正启动了IaaS技术的研发,当时对标了业界比较主流的几个开源项目,因为OpenStack刚刚建立,还非常不成熟,所以最开始是用OpenNebula;到了2013年,OpenStack成长的非常迅速,形成了很好的产业环境和商业化机会。

在孙少陵看来,运营商喜欢标准化的产品,而标准化和开放化也是整个电信业的商业逻辑,“我们当时对OpenStack作了全面的评估,意识到它已经成为事实标准,最后我们做出了艰难的选择,将研发路径从OpenNebula切换到OpenStack平台。”

这是一个很艰难的过程,因为在2010、2011年的时候,中国移动在OpenNebula的贡献度已经是全球最多,中国移动投入了大量的技术研发,已经变成了OpenNebula的一个标杆。

在完成了切换以后,中国移动开始了在OpenStack上蒙眼狂奔。在2013年,中国移动开始基于OpenStack的“大云”3.0版本的开发,并且在2014和2015年分别发布了“大云“3.0和基于“大云”4.0的两个版本。目前,中国移动基于OpenStack Kilo版本的大云4.0的版本,已经有非常大规模的应用,目前整个部署规模超过了4000个节点。“之所以我们选择OpenStack,因为它有开放的价值,行业事实的标准,具有平台无关性、分布式、标准化、以及持续交付的特性,这些都是我们认为对中国移动未来运营非常关键的特性。”孙少陵说。

言胜于行:在场景中做创新

不懈的投入终于换来了丰硕的成果,苏研目前在云计算的几个层面(IaaS/SaaS/PaaS)上,都形成了完整的解决方案。更难能可贵的是,苏研现在从操作系统层面就做到了自主定制开发。

“我们现在正在维护中国移动自主的Linux操作系统的发行版,今年部署规模预计会超过1万台,这样才能保证对未来整个产品体系架构的控制。”孙少陵说。

多年的研发工作经验,使得孙少陵非常愿意用技术和案例来说明情况。在公有云方面,中国移动充分借鉴了OpenStack架构,在起步阶段就把整个网络搭建在SDN基础之上。到现在为止,中国移动已经上线了各为1000个节点的北京和广州两个集群,今年还将再部署4000台服务器;预计到2016年年底,整个公有云上会超过6000个节点,这将雄踞全球榜首。

不仅仅是在公有云,在私有云方面,中国移动也在进行积极部署,“我们对于私有云的定位是要承载中国移动未来全部的IT支撑系统和内部业务系统,这应该是全球业务最复杂、对于系统的可靠性、安全性要求最高,也是规模最大的私有云系统之一。”孙少陵说,“我们预计要在哈尔滨和呼和浩特各建设一个数据中心,总共规模超过6000个节点。”

规模只是一方面,在几年的部署过程中,中国移动对原生的OpenStack进行了大量应用开发和测试工作,积累了大量的经验,也突破了很多困难。公有云方面,中国移动实现了OpenStack和OpenNebula两大集群的统一管理;在私有云方面,中国移动OpenStack平台也是构建在SDN网络上,既要管理物理机,也要管理虚拟机,这个在全球也是没有先例的,“我们通过引入Ironic技术,实现了对4500台裸机的管理。”

而另外一个很大的创新工作则在于OpenStack大规模系统测试,中国移动做了很多的重要测试,其实就是考验OpenStack到底能做到多好。“这里我想着重提两个案例:第一,2000个并发创建虚机去考验Nova性能到底能达到怎样的水平,原生的系统部署上以后测试结果不理想,我们和英特尔一起做了大量的优化工作,最后将它提升到99.9%;第二,Nova性能达标之后,去考验一下OpenStack对外部请求的处理能力,最开始原生系统也只能达到每秒1.78个请求,我们经过优化以后提升了3倍,达到每秒5.49个请求。”孙少陵说。

作为中国移动在OpenStack上的紧密合作伙伴,英特尔相关技术专家也告诉C114,英特尔和中国移动在OpenStack领域的很多想法都是不谋而合。“英特尔在2012年就提出了自己对于云计算的愿景,那就是互联互通、自动化以及终端自适应。作为一家提供底层硬件和上游社区代码的公司,英特尔也非常乐于和中国移动这样的合作伙伴合作,这不但体现了OpenStack在企业级市场的逐步成熟,另外也创造了更多的应用场景,共同推动了全球云计算和开源社区的发展和成熟。”

当然,对于任何一个开源组织和社区而言,生命力要想长久,就必须要得到参与者们的积极贡献。中国移动在OpenStack不仅仅是使用者、受益者,实际上也在积极反馈经验给社区,“我们现在排名全球的第34位,在奥斯丁和巴塞罗那OpenStack峰会上,我们都做了很多的发言和经验分享。目前,我们正在牵头OpenStack千节点工作组。”孙少陵说。

文章转载自 开源中国社区[http://www.oschina.net]

时间: 2024-10-16 06:08:18

全球最大的 OpenStack 集群背后:中国移动的开源之旅的相关文章

OpenStack集群支持多虚拟化技术的实现方法

OpenStack 每个新版本都能实现一些需求和解决一些问题.其中被企业用户问的最多的一个问题是:同一个 OpenStack 集群能同时支持多种虚拟化技术么(Mutil-Hypervisor)? 答案当然是 Yes!在说明如何配置 Mutil-Hypervisor 前,我们需要了解什么是 Mutil-Hypervisor. Mutil-Hypervirsor 简介 对很多用户来说,仅采用一种虚拟化技术难以满足他们的需求,所以用户可能会同时采用其它虚拟化技术.比如:1.用户不想被某个虚拟化厂商绑定

小而美集群背后的电商平台价值

「论道"小而美"(第二季)」 1."小而美"进一步凸显淘宝虚拟shoppingmall电商平台竞争差异性 目前,国内的电子商务模式已经很清晰了:一种是以京东商城为代表的B2C零售商模式,还有一种就是像天猫这样的线上虚拟shoppingmall式的纯平台模式.天猫是纯开放平台模式,天猫平台是完全不控货的.对于垂直型B2C和平台型B2C两种电商商业模式而言,前者既是B又是2,但B只有1个,既做卖家,又做网站:后者只是联结B和C中间2,即网站,B有n个.因此,决定了他们的

从0到15万,回望京东容器集群的3年建设之路

  1 从0诞生  2013年初,京东商城研发布局虚拟化技术方向.那时的我们从0起步.从几人小团队开始起航.   在物理机时代,应用上线等待分配物理机时间平均在一周.应用混部要看脸看颜值的,没有隔离的应用混部如履薄冰,所以在物理机时代混部的比例平均每台物理机低于9个不同应用的tomcat实例.   从痛点入手可以极大提升新项目的落地实践机会.即刻我们着手规划京东虚拟化平台项目.从痛点以及当时2013-2014年的技术氛围可以容易想到,京东是从Openstack开始,那个时代Openstack研发

淘宝Hadoop集群机器硬件配置

淘宝http://www.aliyun.com/zixun/aggregation/14119.html">Hadoop集群机器硬件配置 国内外使用Hadoop的公司比较多,全球最大的Hadoop集群在雅虎,有大约25000个节点,主要用于支持广告系统与网页搜索.国内用Hadoop的主要有百度.淘宝.腾讯.华为.中国移动等,其中淘宝的Hadoop集群属于较大的(如果不是最大). 淘宝Hadoop集群现在超过1700个节点,服务于用于整个阿里巴巴集团各部门,数据来源于各部门产品的线上数据库(

FastDFS 集群 安装 配置

这篇文章介绍如何搭建FastDFS 集群 FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储.文件同步.文件访问(文件上传.文件下载)等,解决了大容量存储和负载均衡的问题.特别适合以文件为载体的在线服务,如相册网站.视频网站等等. FastDFS为互联网量身定制,充分考虑了冗余备份.负载均衡.线性扩容等机制,并注重高可用.高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传.下载等服务. 环境准备 系统系统 centos6.5 六台服

中国移动拥抱开源技术:建成全球最大的OpenStack云平台

在昨日举行的OpenStack China上,中国移动苏州研究院云计算产品部技术总监刘军卫表示,中国移动将在2016年底建成最大的OpenStack公有云平台:在今年5月,建成了全球最大的OpenStack私有云平台. 目前,中移动已建成最大的单集群OpenStack公有云生产环境 (单机房1000节点) ,其已经正式上线2个集群,共计2000个节点 (广州.北京) .到2016年底,建成最大的OpenStack公有云平台之一,完成4个集群共计6000个节点规模的公有云建设. 在今年5月份,中国

Easystack发布新容器集群产品 成为中国首个OpenStack+K8S专业开源企业

3月29日,EasyStack(北京易捷思达科技发展有限公司)在德国柏林举行的CloudNativeCon+KubeCon容器大会上,正式发布基于Kubernetes技术的容器集群产品ESContainer.此举使得EasyStack同红帽.Mirantis一道成为全球三大同时具备OpenStack和Kubernetes(K8S)产品的专业开源企业,也是中国首个OpenStack+Kubernetes专业开源企业.   CloudNativeCon+KubeCon现场 2016年,是容器技术全面

Linux集群和自动化运维

Linux/Unix技术丛书 Linux集群和自动化运维 余洪春 著 图书在版编目(CIP)数据 Linux集群和自动化运维/余洪春著. -北京:机械工业出版社,2016.8 (Linux/Unix技术丛书) ISBN 978-7-111-54438-8 I. L- II.余- III. Linux操作系统 IV. TP316.89 中国版本图书馆CIP数据核字(2016)第176055号 Linux集群和自动化运维 出版发行:机械工业出版社(北京市西城区百万庄大街22号 邮政编码:100037

专访高德地图开放平台的负责人童遥:跨机房同步和多路写入Redis集群方案将得到充分发展

杭州·云栖大会将于2016年10月13-16日在云栖小镇举办,在这场标签为互联网.创新.创业的云计算盛宴上,众多行业精英都将在这几天里分享超过450个演讲主题. 为了帮助大家进一步了解这场全球前言技术共振盛会的内容,采访了各个论坛的大咖,以飨读者. 以下为正文: 童遥,高德地图开放平台的负责人,也在负责高德在线服务的研发工作. 关于本次云栖大会的分享内容,童谣表示,高德地图既为大家提供出行服务,也为三十多万款应用提供LBS API能力,在这样大并发压力下和跨机房的Redis应用场景中,有一些实践