从大数据到云计算,今天的 CIO 们正苦苦寻找着如何挖掘数据中心更多价值的新方法。以无处不在的智能网络体系为核心,采用虚拟化的架构和模式,随业务的需要灵活配置资源,让数据中心更智能,更环保,更绿色,并能将连接,存储,应用等其他 IT 资源有机的融合在一起已经越来越成为当今数据中心的主流趋势。
现代数据中心的资源分配方式,一方面考虑最大化,即留有充分的冗余和空间来适应未来的增长,这样必然造成资源的闲置与浪费。另一方面,无法有效的管理和评估数据中心内现有设备及系统的运行状态和资源利用情况。这样势必不符合低碳,节能,环保,绿色的大潮流,也无法跟上日益变化的需求,无法真正做到所见即所得,按照需求有效分配的商业模式。
智能数据中心解决方案逻辑架构
为了应对日益增长且不断变化的需求,最大化利用现有资源,保证最大的投资收益回报,智能数据中心解决方案就是这样一个背景下应运而生的。你可以认为数据中心是一个高度集成各子系统并让他们协同工作的“IT 航母”。如何最大程度的优化各子系统,让他们更高效,稳定的运作成了现代数据中心刻不容缓的职责。随着云计算的大行其道,对虚拟机器的规划,监控与管理也变得越来越重要。
接下来,我们将从可视化管理的角度阐述智能数据中心如何克服这些困扰我们多时的问题,让数据中心成为我们单一的入口。通过该入口,我们可以轻松的管理其他周边各子系统的运行状况,让我们的资源更加可控,更加有效率,摆脱以往在各个子系统中疲于奔命的窘态。
图 1 智能数据中心解决方案逻辑架构图
通过图 1,我们可以看到智能数据中心解决方案将整合包括空间,资产,空调,温度,安全,网络等等所有数据中心必备因素在内的各个子系统。这样的好处在于,我们将可以以一个整体的方式来对待所有的元素。比如,当我们需要查看网络状态时,直接切换到网络模块;如果需要了解数据中心的物理空间是否能满足公司未来一段时间的发展需求,直接查看空间管理模块;如果需要实时了解数据中心的温度,湿度,空调运行等情况,亦可以通过相应模块得到答案。
在当今所有的系统或者解决方案中,由于各个系统所包含的元素越来越多,这样导致所有这些组件在物理位置上很难保证在相同的物理平台上,因此网络也正承载着越来越重要的角色。通过畅通的网络连接,我们几乎可以忽略距离所带来的影响,让世界各地所有我们想要综合或监控的设备及系统在逻辑上是一个有机的整体。由此,对网络现有资源以及网络健康状态的实时监控就成了任何解决方案所不能忽视的一个重要环节。接下来,作者将详细阐述智能化数据解决方案是如何应对和处理网络的监控和管理的。
智能数据中心解决方案之网络管理
现代数据中心的网络监控大致有以下几种方式:
1.SNMP,即通过在被监控设备上开启 SNMP 协议,并和服务器端协商配置好沟通字串;
2.SSH, 通过脚本直接远程登录到被监控的设备上获取信息;
3.BMC,通过设备内置的 BMC 模块来实现远程监控;
4.Agent, 需要在被监控设备端安装客户端;
以上罗列的几种只是当今比较通用的一些类型,并不排除还有其他的方式,本人仅分析以上几种情况,如需进一步探讨,可以线下交流。
对于这几种常见的方式,各有利弊,可根据特定的环境自由搭配。接下来我们简单分析下他们的优劣。
一. SNMP,这种方式是相对优势最大的一种,因此,它也是被用的比较广泛的一类。SNMP 配置简单,只需在被监控段开启 SNMP 协议,简单配置下与服务器通信的字串即可实现与控制端通信。且幸运的是,现今大部分设备都支持 SNMP 协议。此种方式相对弱势的地方在于,OID 库比较庞大,而且不同厂商之间的 OID 值可能不大一样,所以,当你只需要监控某个特定性能参数时,如何从如此海量的 OID 中找到属于你自己需要的就是一件相对不太容易的事了。如果是一个全面的网络监控,那么 SNMP 方式无疑是最优的,IBM 的企业级监控软件 Netcool 就是采用的该方式。
二. SSH,该方式可能是所有管理员或者熟悉技术的朋友最常见的一种,虽然原始,但是可靠和全面,想看到任何设备能显示的信息。如果搭配一定的脚本,效果更佳。这种方式的弊端也是显而易见的,如果设备较多的情况下,就可能有些力不从心了。
三. BMC, 在 IBM 较新的服务器或者存储产品中都已经支持 BMC 功能了,某些设备可能是使用 AMM。这种方式有两个无可替代的优势,其一,无需在被监控端安装任何客户端,由此可以减少成本及安装客户端所带来的潜在风险;其二,最大程度维持现有架构,因为 BMC 模块式内嵌在物理设备第一个网络端口上的,即物理上不需要进行任何更改。本智能化解决方案即采用了此种方式。
四. Agent,这种方式应该是最常见,且也是最容易实现的一种。弊端也是显而易见的,不是所有被监控端都愿意安装客户端的,由此可能会带来一些推广上的难度,而且对客户端资源或多或少会造成一定影响。
接下来,作者将以图文的形式给大家演示下智能数据中心解决方案是如何一步步来实现网络管理的。
图 2 数据中心网络监控概览
通过图 2,大家可以看到整个数据中心的网络逻辑拓扑图,展现拓扑的同时,我们还可以看到每个设备的 CPU 和内存利用率,电源状态灯等一些实用信息。而且,在逻辑架构图上,我们还能清晰的看到交换机之间实时的输入和输出流量。当我们选中其中一个网络设备后,还可以在图的下方看到该网络设备的板卡信息,如板卡 SN, 序列号,型号等。
图 3 网络设备的操作
除了图 2 中的逻辑架构展示网络设备之外,图 3 也是另外一种更简洁的展示,同时支持同时操作网络设备。在上图可以看到,当我们想要登陆到某个网络设备时,只需输入密码即可。如果需要批量登陆,可以使用脚本来操作,比如 perl。
图 4 BMC 方式监控服务器
图 4 我们可以看到很多服务器的有用信息,如设备型号,序列号,主板温度,资产所有者信息等。除了能够实时监控到这些信息,还可以通过在 BMC 来实现远程开关机,上图中右下角的电源按钮就是此功能的按键。接下来,作者将对 BMC 做一个大致的介绍,给对 IPMI 有兴趣的朋友抛砖引玉。
BMC, 全称 Baseboard Management Controller , 是 IBM 服务器或存储设备上内置的一个管理模块。通过 BMC,即可对没有安装客户端的设备进行远程监控,如果权限需要还可以对服务器进行开关机。
图 5 BMC 配置
BMC 配置非常简单,进入 BIOS 后,选择"Advanced Setup",然后会看到"Baseboard Management Controller (BMC) Settings" ,进入之后,配置好 IP 地址和网关即可。
图 6 IPMI 远程管理
图 6 展示的是在监控的服务器端,通过 IPMI 工具远程验证 BMC 配置是否正确。只要网络正常,通过 IPMI 工具就能从 BMC 客户机上获得所有我们想要的信息。
通过 BMC,IPMI,SSH 等多种方式的在智能数据中解决方案中的综合运用,我们就能轻松的掌控整个数据中心内的各种设备,从而避免了某些软件只能监控网络设备或者服务器的局限性。
结束语
感谢所有为智能数据中心解决方案贡献过青春和汗水的兄弟姐妹们,没有你们无私精神和努力,不会有如今的硕果累累。