世界最大OpenStack私有云是如何运营的

现在国内外都不乏大规模采用OpenStack构建企业私有云的用户,例如Best Buy, BMW, EBay, 和Walmart,尽管Forrester仍对OpenStack在企业中的应用前景持怀疑态度。今天我们来学习一下PayPal是怎么做的,它拥有目前业界最大OS私有云(10+可用区、40万个Core、82000台虚拟机)。

首先来看看PayPal做这件事的背景。eBay作为老牌的电子商务公司,曾经和AOL、 Yahoo一样是全球访问量最大的网站,但是最近几年eBay发展缓慢,没有抓住电商市场的迅速崛起的大好时机、被亚马逊等后起之秀抢去了很大份额,龙头地位不复存在。今年早些时候,为了不让eBay继续拖累PayPal的发展,股东们决定将PayPal分拆出来。

PayPal的IT部门任务艰巨,他们一方面要尽快把IT系统从eBay分离出来,另一方面还要准备应对假期消费高峰对系统造成的压力,留给他们的只有7个多月的时间(准确地说,用6个月时间构建新的IT环境,再用10周时间将业务从原有的IT环境中迁移过来)。

一、构建篇

在构建方面,PayPal的工程师最关心扩展性和可用性,具体涉及以下几个方面:

首先是可用性,基于Nova的Cell来实现IT服务的可用性。

其次是弃用那些过时的工具,以负载均衡为例,eBay和PayPal花了几年时间试图自己开发工具以实现LBaaS,最终还是决定改用社区的功能组件,因为社区的组件更开放,合作伙伴更容易在上面开发插件。

在线升级和测试 这一功能对于平台的健壮性和扩展性尤为重要,能够在线升级,才能跟上社区发展的脚步。

实时容量扩展 PayPal的目标是新机架到货之后,只需要1-2天就可以完成部署并上线应用。

二、迁移篇

相对于构建一个新的系统,将应用和数据迁移到新的架构则更具挑战,我们来看看这次迁移任务的细节和面对的挑战:

有限的工作人员;

超过8000台机器;

2PB的公共数据,以及大量存储于虚拟机内的本地数据;

上述应用和数据位于3个不同的地点;

通过迁移将可用性技术从Nova Availability Zone变更为Nova Cell Service以实现更好的可用性和扩展性;

变更防火墙配置,制定访问规则;

检验并解决新硬件的兼容性问题,确保新系统的稳定性。

下面是PayPal通过这一次迁移总结出的经验:

基础架构的可见性对保持配置一致性非常重要 如果你没有一个关于基础架构的完整视图,那将是致命的。比如你在部署应用的过程中如果有虚拟机宕机了,等它重新恢复工作时,上面的应用和配置将是不正确的。

不要指望所有的应用和开发工作都能迁移到新的环境 必然会有无法迁移的部分,在云计算时代,少几个虚拟机应该不是什么大问题。

不要一开始就使用自动化配置工具 PayPal先用手工的方式完成5%-10%的配置工作,在确定一定正常之后才引入自动化的方法完成后绪的工作。

迁移API服务的时候要万分小心 很多自动化操作基于这些API完成,因此你不能随便停止这些API服务,选择关键操作的执行间隙来迁移服务,并且不要指望在一个时间窗口内迁移所有API服务。

要清楚你迁移的是什么 不要为了节省时间而停止你的生产API或实例的虚IP,那样会增加风险。

切记,如果遇到问题,你不一定可以回滚配置。

补充说明一下这个Cell,它是用来替代原来的Zone以更好地解决OpenStack的扩展性问题,这部分内容OS借鉴了AWS的做法。一个OS云首先分为多个Region,不同的Region通常需要不同的地域,多个Region之间只有 KeyStone和Horizon服务是共享的,因此Region可以用来实现隔离和优化访问。Region的下一级就是Cell,每个Cell都有一套独立的数据库和消息队列服务,另外Cell是树形结构,只有树根Cell有Nova-API服务,因此也被称为API-Cell。其它的子Cell都共享这个Nova-API服务,而Nova的其它服务则分布于每一个Cell,子Cell也称计算Cell。

PayPal提到Cell这个组件目前功能还不完整,在数据同步方面还有一些不足,但是因为扩展性和可用性需要,PayPal必须用Cell来代替原有的Zone。

三、工具篇

PayPal使用了一些开源工具:

Graphite用于绘图

Puppet和Salt用于配置管理

Zabbix用于监视

Cobbler用于裸机部署

另外PayPal自己开发了一个名为Flyway的迁移工具,用于从eBay云向PayPal云迁移几千台虚拟机和相关资源。它负责完成下述资源的迁移工作:

Nova虚拟机

用户、租户、角色、密钥对和限额

镜像和快照

Cinder卷和数据

Trove数据库实例

LBaaS VIP实例和证书

PayPal计划将这一工具开源到GitHub。此外,PayPal还开发了其它一些迁移辅助工具:

Stackwatch/Stackmetrics用于健康检查和度量

Reparo用于服务器修复和置备,也负责硬件监测和补丁管理

Cloudinfo用于云的可见性,将各种视图和相关数据汇总到一起,也提供Metric视图。

CloudMinion用于资源回收 通过扫描网络流量发现闲置虚拟机,管理过期时间,发送告警,自动回收资源并提供报告。

CMS 用做中央配置数据库,集中存储和管理物理和虚拟组件,基础架构和应用等所有资源的信息,并可以呈现这些资源之间的关系。

四、未来篇

采用Masterless Puppet构建更具扩展性和可用性的配置管理方案,消除单一故障点。

Infra AZ项目:通过OpenStack来部署OpenStack,开发更好的控制平面,提高容量扩展速度,实现一键扩容。

从H版直接升级到Kilo版,数据平面不能停,控制平台只有几个小时的窗口,部分网络需要从Nova-Network升级到Neutron。

五、西蒙乱谈

采用开源技术要跟对主流,社区是靠一个庞大的群体来支持的,你对社区产品的增强只能是锦上添花,如果那块绣布烂掉了,你的手艺再好也是白搭。

OpenStack成长很快,正在不断完善,可堪大用,但因为它的定位只是一个框架,需要与大量的相关组件进行集成才能落地,因此采用社区版本自主开发云平台并不容易,你需要组建一个与社区联系紧密的专家团队。

OS在监控和运维管理方面相对薄弱,还有很多不足,PayPal在这方面花的功夫最多,如果不能很好地解决这一问题,就不要大规模采用OS,否则你会把自己拖死。

网络也是OpenStack短板之一,PayPal采用Neutron加上NSX来满足业务对网络服务的需求。

本文转自d1net(转载)

时间: 2024-09-06 08:50:19

世界最大OpenStack私有云是如何运营的的相关文章

OpenStack私有云的好处、挑战和未来,你都知道吗?

Openstack增长势头可喜,但英国IT专业人士仍面临着管理和集成云基础设施的主要挑战. 英国的许多企业都转向使用私有云来运行关键任务应用程序,80%的高级IT专业人员已经迁移或计划迁移到OpenStack私有云. openstack SUSE在最近的一项研究中探讨这种"云选择"的影响和采用率,研究了私有云的主要优势及其对英国企业的影响. 广泛应用 OpenStack的业务优势导致其人气的真正增长. 机构可以使用OpenStack来实现创新,同时降低成本,以及由于其灵活性而更快地满足

托管OpenStack私有云能够获得支持or单打独斗?

OpenStack私有云托管作为一种服务可以简化企业的部署和运营,并强调了云计算的优势,而非Linux的优化. OpenStack的私有云用户已经开始走出厨房(依靠外部服务),而不太喜欢自己做晚餐了(不自己动手),并且坐在饭厅里等着现成的. 这是从使用OpenStack代码向私有云和自行运行方向转变.取而代之的是,新的产品和服务已经出现,提供了更多的掌控,甚至直接管理OpenStack私有云. 蒙特利尔信用合作社Desjardins的云运营协调员Pier-Luc Baillargeon表示:"在

VMware迁移到OpenStack私有云要了解的那些事

VMware和OpenStack经常被描述为相互竞争的两种私有云技术.虽然这两种技术其实可以互补,但一些组织却选择从VMware迁移到OpenStack的私有云上. 让我们来看看这些组织如何能同时使用这两种技术--无论是长期的,或是走向完全基于OpenStack的云的铺垫. 首先,要记住很重要的一点,OpenStack不是一个虚拟机管理程序.它可以通过抽象层支持大多数的虚拟机管理程序,这也为我们开启了可以使用它的自动编排能力的绝佳机会. 一个具体的例子可以清楚的解释这一点.Intel的IT部门在

Gartner:OpenStack私有云属于“科学项目”

根据Gartner公司研究主管Alan Waite的观点,OpenStack确实是一套行之有效的私有云实现方案,但前提是大家必须拥有能够投入项目当中的充裕人力储备,同时作好了处理大量编码工作的准备. 在Gartner公司,Waite的关注对象主要是技术专业人士,这位分析师的任务是帮助IT专家解决问题,而非直接面向技术套件.因此,他的观点主要汇总自产品测试结果以及其它Gartner公司用于调查发展趋势的Delphic Ones分析方案.根据他的预计,OpenStack未来将获得成功,惟一的悬念在于

何宝宏:国内OpenStack私有云发展仍存三大挑战

在昨日举行的OpenStack China上,云计算开源产业联盟常务副理事长何宝宏称,目前国内,OpenStack正在快速发展,产业链也正在形成,尤其是在云计算上的应用正在快速增长. 但国内以OpenStack为基础的私有云发展仍然在产业落地,弹性效率和互操作等技术研发,产业生态建设三方面存在挑战. 据何宝宏介绍,在产业落地方面,客户对开源的认知,客户需求和技术场景断层,厂商配套服务难以满足等仍旧制约着私有云的发展.例如,IT人员对于私有云理解不够,不同私有云标准不统一,部署周期长,迁移困难,维

Rackspace和戴尔EMC合作推出基于OpenStack的私有云即服务

Rackspace和戴尔EMC星期一在波士顿召开的OpenStack峰会上宣布,两家公司正在合作提供私有云即服务解决方案. 据Rackspace说,此举仅为Rackspace与戴尔EMC扩大合作伙伴关系的第一步,此举旨在令各种机构可以更容易地开始使用公共云.Rackspace与戴尔EMC的合作伙伴关系意味着客户可以将Rackspace的OpenStack私有云解决方案与戴尔EMC的计算和存储硬件结合在一起.两家公司一开始时将为VMAX Hybrid.VMAX All Flash和Dell服务器提

分析师称:用OpenStack建立私有云是项艰巨的任务

如果你听信OpenStack方面的大肆炒作,就会觉得它简直就是灵丹妙药,提供了诸多快速.相对容易.具有成本效益的工具,便于将企业应用程序作为云服务来部署.一些分析师却不太乐观,他们认为利用OpenStack建立私有云是项艰巨的任务. 为此,我们采访了沃尔玛.时代华纳有线和PayPal这几家大企业的OpenStack开拓者.他们表示,OpenStack已准备好迎来黄金时期,部署到企业的时机业已成熟,前提是弄明白潜在的陷阱和障碍. 你要有合适的人员,要从小处着手,还要准备处理升级.扩展性和易用性等几

私有云的狂欢,2020年OpenStack市场规模将达50亿美元

451研究所近日大幅调高了OpenStack的预期市场规模,并预测OpenStack的收入将主要来自私有云的部署. 根据451研究所最新的OpenStack Pulse 2016报告(获取报告摘要版请关注IT经理网微信号:ctociocom,后台回复:OpenStack Pulse 2016+邮箱地址),开源私有云项目OpenStack产品收入正在以每年35%的高速增长,2017年OpenStack的试产规模将增长至25亿美元,2020年市场规模将突破50亿美元. OpenStack目前的收入主

使用OpenStack云操作系统为私有云构建Linux和Windows映像

开源 OpenStack 云操作系统是一个功能丰富且可以大规模扩展的平台,适用于所有类型的云计算.一些公共云服务基于 OpenStack,许多组织内的私有云实现也是如此.但 OpenStack 仍缺乏一些针对私有云的特性,尤其是针对开发和测试环境的特性.例如,映像构建就不是一个简单的过程.本文为 OpenStack 私有云提供一种全新且改进的映像创建方法.我们在 QEMU/KVM 平台上验证了这种新方法,但在理论上该方法也适用于其他虚拟机管理程序平台. 介绍这个新方法之前,我们将概述目前在 Op