Alibaba Data Center Brain——阿里基础设施智能化之实践

本文PPT来自阿里基础架构资深专家周宝方于10月16日在2016年杭州云栖大会上发表的《Alibaba Data Center Brain——阿里基础设施智能化之实践》。

这一切还得从DC Brain说起,随着业务地不断发展,数据的快速增长,DC Brain受到了来自Saas、Paas和Iaas三个层次的挑战。这些挑战主要包括研发协同平台、服务产品化、虚拟化/软件定义、解耦和提高资源利用效率等。除此之外,在架构上DC Brain还需要满足以下六点: 1.大规模、可扩展的数据中心 2.架构简单、高速的物理网络 3.规模一体化、规格少的服务器 4.可软件定义、用于灵活解决业务的虚拟化 5.解决资源利用率的调度机制 6. 智能化的数据驱动。

DC Brain 在形态上采用了数据驱动的基础设施治理模式,其整个模型的运作由简单事件引擎、离线日志模型、在线日志分析模型、基线异常模型、服务状态模型、收敛模型等部件共同完成。另外,在网络领域,DC Brain 能对故障进行快速定位和恢复,感知配置变更的影响。在服务器硬件方面,DC Brain能对服务器性能进行智能诊断,基于硬件的配置参数和状态明确给出硬件性能状态百分比,从而可以发现硬件瓶颈点和热点操作,帮助业务性能优化,最终为硬件方案、选型、配置提供依据,为软硬件结合提供输入。

目前,DC Brain还在路上,相信在广大的工程师的维护和发展下,未来的DC Brain将会变得更加智能。

时间: 2024-11-05 21:37:33

Alibaba Data Center Brain——阿里基础设施智能化之实践的相关文章

Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center

Mesos: A Platform for Fine-Grained Resource Sharing in the Data Center   为什么需要Mesos? 现在有越来越多的compute framework, 并且每个framework都有自己的适用场景和优缺点. 比如Hadoop, MPI, Pregel, Spark--  所以往往需要build不同的framework来满足不同的需要, 问题是如果不同的framework搭建在不同的cluster上, 太不方便了  首先那么多

Intel SSD Data Center Family for SATA中存在潜在漏洞

故障现象: Lenovo 安全公告:LEN-6022 潜在影响:拒绝服务 严重性:高 影响范围:全行业 摘要描述: 某些 Lenovo System X 服务器采用 Intel 固态驱动器(SSD). Intel SSD Data Center Family for SATA 产品系列设计符合 ATA-ACS 规格.Intel 发现了一个漏洞,该漏洞表现为如果 Intel SSD Data Center Family for SATA 产品接收到某些违反 SATA 协议的命令,驱动器可能会停止响

数加平台——阿里大数据OS实践

在云栖计算之旅第5期--大数据与人工智能大会上,阿里云大数据事业部数加平台技术负责人陈廷梁从数加定义.起源.愿景.价值.架构.规划六个方面分享了<数加平台--阿里大数据OS实践>.其中,他主要介绍了数加平台的演进过程和阿里大数据OS的架构.   以下内容根据视频整理而成.   视频回顾:点此进入 pdf下载:点此进入   数加是什么 在阿里云的官网打开大数据部分(整个大数据部分统称为数加),其中包括:大数据基础服务部分,MaxCompute.ADS.流计算.大数据开发套件:人工智能部分,机器学

双11背后基础设施软硬 结合实践创新

前言 阿里巴巴作为全球领先的互联网综合业务平台,其遍布全球的数据中心中海量IT硬件设备(服务器和网络)承载了世界上最全的业务体系.一方面各种互联网服务种类之广.应用类型之多.对硬件能力需求之差异,另一方面连续7年的双11狂欢节这类世界级的玩法,对于整个集团整体业务.产品.技术体系的挑战虽不绝后,但一定空前.由此要求与之一体两面的基础设施技术能力必须要解决世界级的问题,建设世界级的架构,掌控核心的关键部件技术. 在广义数据中心总体拥有成本(TCO)模型分析下,其中IT硬件设备通常是资本费用(Cap

【直播】React、AliSQL、BeeHive、JStorm等8大阿里开源项目最佳实践分享

  本次峰会精选了目前较为活跃的阿里开源项目,其中较为有看点的是:在GitHub上拥有超过一万Star.在阿里内部落地超过400个项目的React 组件库 antd在蚂蚁金服的实践:MariaDB基金会唯一的中国成员详解AliSQL功能特性:已在天猫.喵师傅,天猫家装等App中应用大型iOS项目解耦方法--BeeHive:Android平台页面路由框架ARouter的一手开发经验:开源的 Android 平台上的秒级编译方案.阿里巴巴 Github 下排行前十的开源项目Freeline背后的奥秘

阿里巴巴沈询: 阿里企业级互联网架构实践

 [51CTO.com原创稿件]2017年4月14日-15日,由51CTO主办的WOTA全球架构与运维技术峰会在北京富力万丽酒店隆重召开.本次WOTA设置了15大前沿热点技术论坛,60+来自Google.LinkedIn.Airbnb.百度.阿里巴巴.腾讯等海内外一线互联网公司的技术大咖将带来超过50个历经沉淀的架构实战心得与成功经验分享案例,携手打造历时2天的行业顶级技术盛会. 在4月15日上午WOTA2017分论坛,阿里巴巴资深技术专家沈询带来了主题为<阿里企业级互联网架构实践>的精彩演讲

感受开源之力,参加“阿里开源项目最佳实践”峰会5大理由!

开源是孵化新技术领域的容器,开源是技术演进的强大推动力.多年来,阿里巴巴集团一直积极拥抱开源事业,无论是开源软件的应用.回馈以至自研技术的开源都非常活跃.2016年更是阿里技术开源的丰收年:73款产品开源.JStorm.RocketMQ.Weex三连捐Apache基金会.Weex在GitHub上Star破万.阿里云成为MySQL开源分支 WebScaleSQL 的发起成员:不仅量多而且质精:在开源中国公布的"2016年最受欢迎中国开源软件评选"的结果中,阿里巴巴独占TOP20中的4席.

思科Analytics Data Center一体机 加速客户采用新技术

思科将发布一款分析平台,让渠道合作伙伴可以更多地实时洞察客户的整个数据中心,另外,计划加速软件定义网络等新技术的采用. Enterprise Networking Solutions Group of World Wide Technology是一家位于马里兰Maryland Heights的解决方案提供商,同时也是思科金牌合作伙伴,该公司实践负责人David Chandler表示:"这将客户迁移到更为现代化的技术,从这些传统的基于硬件的系统,到基于云和软件定义网络的系统.如果一位客户希望从传统

智能语音交互:阿里的研究和实践

云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲.本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出.   在众多的人工智能应用中,智能语音交互是大众能够最近距离接触到的一个.从几年前的手机语音助手,到近年来的互联网汽车.智能音箱.电视.IoT设备等,语音交互正以前所未有的深度和广度,融入雨后春笋般涌现的各种智能设备中.国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域,并视其为下一