经济的发展导致提供软件和计算能力服务基础架构的出现,俗称云服务或云计算。它是一种新兴的共享基础架构的方法,利用它用户可以在任何地方通过连接的设备访问其应用程序。可以将巨大的系统池连接在一起以提供各种IT服务。很多因素推动了对这类环境的需求,其中包括连接设备、实时数据流、SOA的采用以及搜索、开放协作、社会网络和移动商务等这样的Web 2.0应用的急剧增长。 另外,数字元器件性能的提升也使IT环境的规模大幅度提高,从而进一步加强了对一个由统一的云进行管理的需求。毫无疑问,云计算已经拥有了一个光明的前景。
云计算实例分析
本文最后对引领云计算潮流的两大公司google和IBM的云计算平台做一个简单的分析。
短时间内Google的在云计算上的地位依然不可撼动,其开放式的平台体现了云计算模式的精髓。Google的云计算服务所需要的绝大部分基础软件都是开源的,这意味着用户可以自由的得到那些代码并修改。从2003年开始,Google连续几年在计算机系统研究领域的最顶级会议与杂志上发表论文,揭示其内部的分布式数据处理方法,向外界展示其使用的云计算核心技术。Google的云计算技术实际上是针对Google特定的网络应用程序而定制的。针对内部网络数据规模超大的特点,Google提出了一整套基于分布式并行集群方式的基础架构,利用软件的能力来处理集群中经常发生的节点失效问题。Google使用的云计算基础架构模式包括四个相互独立又紧密结合在一起的系统。包括Google建立在集群之上的文件系统Google File System,针对Google应用程序的特点提出的Map/Reduce模式(映射/化简编程模式),分布式的锁机制Chubby以及Google开发的模型简化的大规模分布式数据库BigTable.
GFS(Google文件系统)是为Google应用程序本身而设计的。一个GFS集群包含一个主服务器和多个块服务器,可以被多个客户端访问。
为了让不熟悉分布式系统人们能够有机会将应用程充建立在大规模的集群基础之上,Google还设计并实现了一套大规模数据处理的编程规范Map/Reduce系统。这样,非分布式专业的程序编写人员也能够为大规模的集群编写应用程序而不用去顾虑集群的可靠性、可扩展性等问题。应用程序编写人员只需要将精力放在应用程序本身,而关于集群的处理问题则交由平台来处理。Map/Reduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节点会周期性的把完成的工作和状态的更新报告回来。如果一个节点保持沉默超过一个预设的时间间隔,主节点(类同Google File System中的主服务器)记录下这个节点状态为死亡,并把分配给这个节点的数据发到别的节点。每个操作使用命名文件的原子操作以确保不会发生并行线程间的冲突;当文件被改名的时候,系统可能会把他们复制到任务名以外的另一个名字上去。
第三个云计算平台就是Google关于将数据库系统扩展到分布式平台上的BigTable系统。为了处理Google内部大量的格式化以及半格式化数据,Google构建了弱一致性要求的大规模数据库系统BigTable.除了这三个部分之外,Google还建立了分布式程序的调度器,分布式的锁服务等一系列相关的云计算服务平台。
蓝色巨人IBM对此也投下了重注,并为此命名为“蓝云”计划。IBM具有发展云计算业务 的一切有利因素:应用服务器、存储、管理软件、中间件等等,因此IBM自然不会放过这样 一个成名机会。最近又推出了“新企业数据中心”的设想,该设想结合了以 Web 为中心的云 计算模型和当前的企业数据中心的优势。中国云计算网的一篇文章给出了“新企业数据中心” 模型以及其基础架构服务框架。
新企业数据中心将是虚拟化、高效管理的中心,它将使用以 Web 为中心的云所采用的 某些工具和技术,并进行一般化以便被范围更广的客户采用,另外还进行增强以支持安全的事务性工作负载。通过高效且共享的基础架构,企业能够对新的业务需求迅速做出反应,实时解析大量信息,而且还能根据实时数据做出明智的业务决策。新企业数据中心是一种演进的新模型,能提供有助于使 IT 和业务目标保持一致的高效且动态的新方法。如图 3 所示,从高级别的架构角度来看,新企业数据中心的基础架构服务在逻辑上可分为不同的层次。物理硬件层已虚拟化,以便能提供灵活且适应性强的平台,从而提高资源利用率。接下来的两层是虚拟化环境层和管理层,它们是新企业数据中心基础架构服务的关键。通过将这两层结合起来,可以确保数据中心内的资源得到有效的管理,并可以快速部署和配置。另外,新企业数据中心旨在处理混合模式的工作负载。