转:阿里云的“飞天“是什么?
一、飞天是什么?
飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统。它可以将遍布全球的百万级服务器连成一台超级计算机,以在线公共服务的方式为社会提供计算能力。
从PC互联网到移动互联网到万物互联网,互联网成为世界新的基础设施。飞天希望解决人类计算的规模、效率和安全问题。飞天的革命性在于将云计算的三个方向整合起来:提供足够强大的计算能力,提供通用的计算能力,提供普惠的计算能力。
二、飞天的主要组成部分包括哪些,架构是怎样的?
* 飞天管理着互联网规模的基础设施。最底层是遍布全球的几十个数据中心,数百个PoP节点。飞天所管理的这些物理基础设施还在不断扩张。
* 飞天内核跑在每个数据中心里面,它负责统一管理数据中心内的通用服务器集群,调度集群的计算、存储资源,支撑分布式应用的部署和执行,并自动进行故障恢复和数据冗余。
* 安全管理根植在飞天内核最底层。飞天内核提供的授权机制,能够有效实现“最小权限原则(Principle of least privilege)”。同时,还建立了自主可控的全栈安全体系。
* 监控报警诊断是飞天内核的最基本能力之一。飞天内核对上层应用提供了非常详细的、无间断的监控数据和系统事件采集,能够回溯到发生问题的那一刻现场,帮助工程师找到问题的根源。
* 在基础公共模块之上,有两个最核心的服务,一个叫盘古,一个叫伏羲。盘古是存储管理服务,伏羲是资源调度服务,飞天内核之上应用的存储和资源的分配都是由盘古和伏羲管理。
* 在基础公共模块边上,还有一个服务,叫做天基。意思是“飞天的基础”。天基是飞天的自动化运维服务,负责飞天各个子系统的部署、升级、扩容以及故障迁移。
* 飞天核心服务分为:计算、存储、数据库、网络。
* 为了帮助开发者便捷地构建云上应用,飞天提供了丰富的连接、编排服务,将这些核心服务方便地连接和组织起来,包括:通知、队列、资源编排、分布式事务管理等等。
* 飞天接入层包括数据传输服务,数据库同步服务,CDN内容分发以及混合云高速通道等服务。
* 飞天最顶层是阿里云打造的软件交易与交付第一平台——云市场。它如同云计算的“App Store”,用户可在阿里云官网一键开通“软件+云计算资源”。云市场上架在售商品几千个,支持镜像、容器、编排、API、SaaS、服务、下载等类型的软件与服务接入。
* 飞天有一个全球统一的账号体系。灵活的认证授权机制让云上资源可以安全灵活地在租户内或租户间共享。
* 七年实践,飞天已经建立一个完善的云产品体系。同时还能提供互联网级别的租户管理和业务支撑服务。
三、飞天操作系统的核心竞争力和核心能力是什么?
- 自主可控:对云计算底层技术体系的把控力,自主研发,自己解决核心问题。
- 调度能力:10K(单集群1万台服务器)的任务分布式部署和监控。
- 数据能力:EB(10亿GB)级的大数据存储和分析能力。
- 安全能力:为中国35%的网站提供防御。
- 大规模实践:经受双11、12306春运购票等极限并发场景挑战。
- 开放的生态:兼容大多数生态软件和硬件,比如CLoudfudry、Docker、Hadoop。
四、飞天操作系统解决了什么不一样的问题?
- 算得起:客户的计算成本问题,即开即用,零capex,零基础运维人员投入,计算资源弹性扩展,降低opex
- 算得快:客户的计算规模瓶颈问题,以及客户应用的实时性问题
- 算得准:客户应用的数据智能问题,让小客户具备和大公司一样的数据智能的能力
- 高可用:客户应用的业务连续性问题,客户的服务可以部署在多个region,并支持灵活多样的数据同步机制,打造高可用系统
- 安全性:安全管理根植在飞天内核最底层,还建立了自主可控的全栈安全体系
- API经济:让开源产品、ISV、SI、和云SP能够有效协同为客户提供服务
行业FAQ
一、飞天与OpenStack和Hadoop的区别?
飞天是一个操作系统,部署在互联网规模的基础设施之上,它以公共服务的方式对外提供服务,可以让用户直接联网使用,并且提供了丰富的云服务、数据服务、完善的安全体系和云市场及生态支撑。通过软硬件一体化,飞天可以实现更优的性能。客户享受的是云上便捷的服务,可以将人力、物力和时间等资源使用在更擅长的领域,从而快速实现商业价值。
OpenStack和Hadoop是软件,它并没有解决客户的capex投入问题、运维人员投入问题,需要部署到自有的硬件上,一般只用于单个企业的内部环境。从软件变成服务,有很多事情需要做。比如说需要把这个软件下载下来,你要知道你的硬件配置是什么,需要去部署上去,还有监控,Hadoop生态圈里面虽然有这样那样的解决方案,但是并没有很好的集成起来,这些选择还是需要你来做。
从软件工程说,飞天是保持版本迭代稳定性和一致性的一个完整架构,而开源是一个树状分支发展体系,无法保障整体诉求的统一性。
飞天上面提供了基于hadoop,EMR,Mongo等开源软件的托管服务,这个是飞天开放能力的体现。
二、飞天和VMware、华为fusion Sphere的区别?
虚拟化不等于云计算。云的实时在线,海量弹性,多租户隔离,专业运维都是传统虚拟化软件所欠缺的。
飞天是一个操作系统,部署在互联网规模的基础设施之上,它以公共服务的方式对外提供服务,并且提供了丰富的元数据服务、数据服务、完善的安全体系和云市场及生态支撑。客户享受的是云上便捷的服务,没必要将人力、物力和时间成本浪费在不擅长的领域,从而快速实现商业价值。
而VMware(ESX、NSX、VSAN)以及华为FusionSphere都是软件,并没有解决客户的capex投入问题、运维人员投入问题,一般只用于单个企业的内网环境,没有完善的多租户体系和生态体系。
VMware的三大件主要解决了计算的效率问题,但是没有解决计算的规模问题。
华为的FusionSphere其实是基于开源软件进行定制并适配华为硬件的软件系统,飞天内核在规模、性能、稳定性和通用性上都超越了FusionSphere。
三、Apsara Stack是什么?跟飞天的关系?
Apsara Stack和飞天公共云计算的技术体系一脉相承,是将飞天内核以及内核之上的一部分云产品经过优化后,可独立部署的系统。它是飞天的一种特殊部署形式,在物理设备达标的情况下,具备和飞天公共云一样的规模、性能、稳定性和通用性。
四、阿里云上售卖的开源产品跟飞天的关系?
飞天从第一天开始,就坚定地走上自主研发的道路,同时非常注重这一系统的开放性。飞天本身提供了一些基于开源软件的托管服务,比如:MySQL、Hadoop等。这主要是为了解决客户已有应用的兼容性问题,其次是帮助客户解决很多开源软件配置管理困难的问题,第三是解决很多开源软件的安全漏洞问题。此外,飞天的云市场上也会售卖第三方基于开源软件包装的云产品。
阿里云上售卖的应用和飞天的关系是:就像苹果iOS与App Store上应用的关系。
五、云计算和超算的关系是什么?
- 1、超算讲的是绝对的计算能力,更多是专业科研机构采用的专用计算能力,计算模型也更专业化,需要客户对模式计算非常了解才用得起来。云计算讲究的是提供普惠的计算能力,老百姓用得起,接地气。(法拉利vs丰田卡罗拉),超算是方程式赛车,云计算更像是纳斯卡赛车。云计算是一个通用且普惠的科技,会随着用户的增加而降低单位使用成本,最终它会变成每一个人都能用的计算服务;
- 2、超算通常不考虑高可用、高可靠、弹性、安全,也不提供海量数据的存储和生态服务能力。
- 3、超算通常是计算密集型的应用,云计算还要兼顾数据密集型的应用,效率和成本超过超算。
- 4、随着云计算的技术发展,越来越多传统只能用超算解决的应用场景,都会跑到云上。
- 5、超算:拿了数据来跑计算;云计算:是数据在哪里,计算就在哪里。