不要将数据中心资源浪费在过度配置上

每个虚拟机必须配置虚拟机实例及其工作负载正常运营所需要的处理器、内存以及存储。资源需求取决于工作负载及其活动等级,因此为虚拟机配置数量合理的计算资源可能是一个棘手的问题。配置的资源太少,工作负载可能表现不佳,变得不稳定或者甚至是彻底宕机。分配太多的计算资源,超额的计算潜能可能被浪费掉,而且会增加业务运营成本。IT管理员必须是检测虚拟机过度配置方面的专家,并采取正确的步骤调整资源使用。

为什么会发生过度配置

很多时候,管理员在一开始给虚拟机配置资源时就出错了。需要计算或内存资源的工作负载的创建者明确提出需要更多的资源完成工作任务。但供应充足的资源与将额外的、根本不需要的资源丢给工作负载之间存在差异。

过度配置往往会发生,因为对特定的虚拟机而言管理员通常不知道哪些资源是必需的、适宜的,尤其是其负载情况一直在不断变化。有时管理员认为虚拟机的性能可能会因无意中的资源匮乏而受到影响。最自然的反应是过度分配以保证问题被修复,同时也可以避免问题经常萦绕于管理员的心头。

下意识的反应并不是一个很好的实践,普遍缺少对应用的理解、规划以及测试。在生产环境中部署工作负载前进行合理的测试有助于建立资源等级或边界。某些IT工作人员还在坚持错误的概念是更多的资源等同于更好的工作负载性能。

VirtualQube是一家云供应商,该公司的CEO Scott Gorcester 说“顾客以及IT专业人员可能认为增加计算资源以及内存能够改进虚拟机性能。但对虚拟机及其应用性能进行测试并进行正确的分析表明在某些情况下存在一个最有效的点,此时系统运行的最好,再增加更多的资源或者没有影响,甚至还可能有副作用。”

例如,分配额外的vCPU看似免费,但某些软件许可受处理器数量的影响,增加处理器可能会触发意料之外的许可费用,增加虚拟机的运营成本。给虚拟机增加内存可能会减少一台服务器能够承载的虚拟机的数量。这限制了工作负载的整合举措,削弱了工作负载的平衡方案,导致企业需要买比实际需求更多的服务器或存储。这反过来导致了更高的运营成本及能耗,引发了对制冷的关注。

找到过度配置的虚拟机

如果没有先判断虚拟机是否过度配置,那么想解决虚拟机过度配置问题是不可能的。某些工具能够为做出决策提供帮助。当虚拟机资源需求发生变化时IT专家依赖远程监控及管理工具,比如Kaseya VSA 以及SolarWinds虚拟化管理器提醒员工。其他人选择了与hypervisor厂商像匹配的工具。

W.P. Carey是一家不动产投资公司,该公司的网络工程师及发布经理Aldo Cabrera说“我们主要使用vRealize洞察系统资源过度配置或资源配置不足的情况。还使用监控工具通过SNMP以及脚本触发器直接对磁盘、网络以及内存使用情况进行监控。”hypervisor平台甚至可能包括性能计数器以及监控功能—比如vSphere的性能图标、主机健康仪表盘、报表以及告警—其他工具比如VMware的esxtop命令行产品。

哪些因素能够反应虚拟机资源存在过度配置的情况?

先考虑处理器利用率。处理器利用率临时出现峰值是正常的,但处理器利用率持续居高不下—可能超过90%—表明存在过度配置。请记住很容易创建更多的vCPU并将其分配给虚拟机,但必须对每个vCPU进行调度并等待物理CPU以处理虚拟机的指令及数据。这导致了更高的就绪时间—通常超过了10%到20%—vCPU排队等待物理处理器资源。这一类过度配置可能会降低服务器上的虚拟机性能。

对比同一台服务器及不同服务器上有问题的虚拟机、其他虚拟机的性能报表。问题的根源往往是vCPU太多,虚拟机太多或者是有问题的虚拟机的CPU限制配置不当。减少不必要的已分配给虚拟机的vCPU,例如,为单线程的虚拟机分配两个或四个vCPU浪费了计算资源,因为单线程应用只能够使用一个vCPU。增加CPU份额优先级或者设置虚拟机CPU预留值允许vCPU更多地访问物理CPU。工作负载平衡—将有问题的虚拟机迁移到具备更多可用资源的其他服务器—也可以减少运行在服务器上的vCPU数量。

配置问题还经常会扩展到内存分配。每个虚拟机应该稍微配置多一些的内存,服务器的内存容量要比所有虚拟机使用的总内存容量大一些。为虚拟机分配过多的内存没有任何好处。定期检查每个虚拟机的内存使用情况、可用内存大小以及活动、已分配的内存容量。

内存使用率过高达到95%或者空闲内存过低—5%或者更少—表明内存配置不足。活动内存经常等于已分配的内存,表明可用内存不足。这会导致大量的磁盘交换,影响虚拟机性能,hypervisor可能会使用具有侵略性的内存回收技术,比如内存膨胀以恢复并重用空闲内存。相反内存使用率过低、可用内存过高表明内存存在过度配置。在某些情况下减少不必要的高内存预留设置也能够释放额外的内存用于内存回收及重用。

存储容量很少会直接影响性能,但仍有必要检查分配给虚拟机的LUN并监控容量使用情况。给虚拟机分配一个不会用到的大容量LUN是对昂贵存储容量的浪费。精简配置有助于减少存储浪费,因为实际安装的物理磁盘容量只占逻辑卷容量的一小部分。例如精简配置100GB的LUN但只分配10GB,然后再增加物理内存的成本要低很多。

监控容量并在已分配的容量用完前增加更多的物理磁盘空间是很重要的。此外,监控磁盘性能参数,比如延迟以确保存储性能问题不会影响虚拟机性能。

合理分配资源

避免虚拟机过度配置的最佳方式是从一开始就给虚拟机分配最合理的资源,但实现虚拟机资源配置合理是一个棘手的问题。很多组织基于最初的分配决定与应用厂商进行详细的沟通,假定厂商对应用及需求理解的最到位。

然而,将厂商的建议作为最终的结论可能并不明智。Gorcester 说:“客户通知我们,他们的软件厂商强烈建议配置48个内核、128GB的内存。调整系统后,我们配置了4个CPU核心、24GB的内存达到了最佳性能。配置了4个以上的核心后用户体验下降,而且不需要配置超过24GB的内存。”

IT员工的专业技能加上性能监控、测试、调优对于建立最好的资源配置以及最好的性价比同样至关重要。先将已确定的最低资源分配给虚拟机,当工作负载需求发生变化时,观察性能并预计变化情况。这是非常正常的,资源不足可以很容易地进行调整。Cabrera说:“最好是低配置或者坚持最低配置建议并进行后续的观察。服务所有者可能不希望减少资源配置。配置合理并增加更多的资源往往受欢迎,但降低配置往往要更困难。”

借助任何资源恢复及工作负载平衡工具同样能够提供帮助。例如,使用hypervisor的资源恢复功能比如动态内存、内存膨胀以及透明页共享。VMware的分布式资源调度及类似工具有助于调配虚拟机迁移并充分利用每个服务器的可用资源。实现了虚拟环境支持的虚拟机总数量的最大化同时为相关工作负载提供了最好的性能。

并非所有过度配置一定是不好的。配置合理的额外资源能够提升工作负载性能,提升用户体验并获得应用利益相关方的好感。但仅仅是配置更多的资源会浪费容量、经费,甚至对正在试图改进的性能问题造成威胁。选择正确的工具并对数据进行客观的评价以做出正确的资源使用决策。
本文转自d1net(转载)

时间: 2024-09-24 12:45:40

不要将数据中心资源浪费在过度配置上的相关文章

虚拟机管理:如何在实践中做好数据中心资源平衡

现今对数据中心的要求是稳固.有效,这首先要做到"合理使用".虽然闲置资源对于一个环境来讲是种资金浪费.但若是没能对频繁使用的数据中心进行合理的资源配置,必将引发危险场景.单一硬件失灵可能导致其他物理主机发生故障.IT管理人员面临的困难在于:使用并管理好遍布整个环境的计算资源(通常包括物理的,虚拟的和云资源).本文将和大家讨论作为达到资源优化这一目的所使用的手段--资源规划和问题缓解.我们还将说明如何在问题恶化之前解决它. 资源规划的最佳实践 当今,几乎所有的数据中心都已经拥有或是将会进

管理远程数据中心资源的五个最佳实践

如今的现代IT基础设施已从一种本地化环境演变成一种分布式数据中心架构.管理员能够利用更好的远程托管服务,帮助自己扩大现有环境,并完成更多与业务有关的IT任务.企业组织在利用云技术和专用的广域网链路,帮助自己扩大现有数据中心,并使用外部资源,用于灾难恢复.扩建.额外的用户工作负载,或者甚至测试和开发. 这些资源可供使用时,人们往往会用完资源.如果环境是本地环境,管理和监控数据中心里面的现有资源可能更容易. 然而,如果有分支机构或其他远程环境也需要监控,该如何是好?要牢记的一个要点是,资源始终是有限

提高数据中心资源利用率的绿色技术

在http://www.aliyun.com/zixun/aggregation/13616.html">新一代数据中心中,为解决传统数据中心的IT资源利用率十分低的问题,CIO们都在不停地选择高效的设备,寻求更高效的系统,以及更多的探索提升数据中心资源利用率的绿色技术.而广泛采用虚拟化技术和系统合并,有助于打破孤岛效应,共享IT资源,提高资源利用率,降低成本,使IT 基础设施具备更高的灵活性,并确保供需平衡.本文就和大家一起分享这两种方法. 合并:提高能效的关键 整合简单的说就是将不同系

数据中心资源向AWS迁移的四大挑战

很多企业将他们的数据中心资源向AWS中迁移,而更多的企业正在考虑向AWS中迁移数据中心资源.数据中心资源向AWS迁移能够带来极大的好处,AWS提供了一整套云计算服务,可以比企业自行构建数据中心更快.更经济地提供大型.可扩展的计算能力. AWS涵盖了近100项服务,包括了分析.计算.数据库.网络.存储.移动等等.企业选择AWS的原因多种多样,可能涵盖了以下一个或多个原因: 企业希望消除本地数据中心或减少数据中心占地面积,数据中心需要广泛的基础设施和专业人员 企业希望通过租用公有云服务来建立混合云,

基于车联网的云数据中心资源调度算法

基于车联网的云数据中心资源调度算法 黄小远,姚卫红 车联网的大量交通数据需要强大的支撑平台进行处理分析,云数据中心正好满足了车联网的需求.但是,车联网应用的特点与云数据中心物理主机配置的不一致通常会引起负载不均衡.针对该问题,本文提出一种基于车联网的CDM-CU 虚拟机部署算法.本算法并不单纯追求虚拟机和物理服务器性能向量的最优距离,也不单纯追求数据中心的最小负载,而是通过调和因子将二者灵活融合在一起,为用户提交的业务选择合适的物理主机来部署相应的虚拟机集.在CloudSim 环境下进行了实验仿

成都规划建设统一大数据中心 非涉密政务信息上“云”

成都是最大的公共数据拥有者,成都将推动所有非涉密信息系统全部迁移上"云",实现跨部门.跨区域.跨层级业务系统互联互通和政务数据资源共享开放.9月4日,成都市政府常务会议审议通过<成都市政务云建设规划(2017-2020年)>,明确了构建"云.网.端.数"四位一体的政务云平台目标. 据了解,政务云已成为国家实施网络强国战略.大数据战略."互联网+"行动计划的重要支撑,省委.省政府也将政务云作为统筹电子政务发展.破解"群众办事难

数据中心服务器托管VMware虚拟化网络配置最佳实践

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://dgd2010.blog.51cto.com/1539422/1765796 通常把自己购买的服务器托管到一个具有双线网络接入的机房是一个不错的选择,每年的成本在1万元左右. 虚拟化能通过增加硬件的利用率来降低运行和维护物理服务器的成本.可以减少运行服务器工作负载所需的硬件数量.虚拟化的核心优势在于通过"一虚多"的方法提高灵活性和可扩展性,简化IT管理降低资金和运维等方

燃料电池在数据中心的应用:是进化还是革命?

如今,数据中心行业厂商越来越熟悉布鲁姆能源(Bloom)公司生产的燃料电池.人们可以在eBay公司.Equinix公司.苹果公司.CenturyLink.AT&T.NTT美国公司,以及Verizon公司等运营的数据中心都可以看到正在运营的银色的"布鲁姆盒子",其为超过150兆瓦的关键任务IT运营提供了电力支持. 五年前首次亮相的燃料电池对数据中心供电系统来说具有一定的历史意义.而对于布鲁姆公司来说,其燃料电池还具有一个更大的目标,就是抢占数据中心的供电系统及设备的滩头阵地.布鲁

数据中心整合:一个经理的资源清单

近年来,云计算市场得以迅速增长,而各种数据中心服务的新需求也在持续增长.云提供商和数据中心合作伙伴正在日以继夜地工作,使他们的环境尽可能高效.这是为什么?是为了最大限度地提高他们的底线,以保持竞争力. 在目前竞争激烈的数据中心和云计算市场中,市场领军企业在运行最优化和成本效益的同时,还要提供优越的服务.为了实现这一目标,企业还要考虑一些事情.首先,在市场上领先并不总是意味着增加更多的设备.智能数据中心和云服务提供商要学会充分利用自己所拥有的资源.另外,在新的数据中心效率概念中,有人提出一些新的问