在金融圈,资产管理行业是一个发展极其迅速的细分领域。在这七年中,业务飞速发展的需求让工银瑞信的IT不得不“加速快跑”,但公司所配备的专业IT人员却始终非常有限。为了解决这一矛盾,他们开始一步步尝试虚拟化,进而过渡到“私有云”。
从刚成立时的几台小型机和机架式服务器,工银瑞信目前共有60多台小型机和200多台基于英特尔至强E7处理器的x86服务器,6000多个信息点……7年时间,几百倍的数据量增长带来了工银瑞信数据中心的多次扩建。公司成立之初,系统数据量只有600GB,但是现在这个数字已经变成了200TB,而明年一季度就会突破300TB。但在公司内部,支撑2家子公司、3家分公司及总部整个IT系统稳定运转的专业工程师却只有12个人。虽然按照金融行业监管机构的要求,这样的人员配备刚好达标,但面对如此规模的基础设施,仅靠12人来管理依旧是难以想象的。然而现实是,这12个人里负责管理基础设施的却只有3人,其他人的主要工作则是做项目管理、应用管理、系统分析等。为张轶团队解围的,正是“私有云”。
一步步走向了私有云
2008年,借助数据中心搬迁的机会,工银瑞信才开始决定逐步实现服务器的全面虚拟化。金融业务不敢过于冒险,所以最初只是把测试系统、内部系统和非重要系统迁移到了虚拟化环境中。“我们花了1年多的时间培训技术队伍,让大家习惯并且接受,同时也能更好的利用虚拟化技术。到了2010年年底,我们才开始进行大规模的虚拟化迁移。”在张轶看来,云计算带给企业的最大风险是IT管理和运维方式的变革,在尝试虚拟化、进行测试、应用迁移实践和培训的过程中,他们不断发现问题、解决问题,这些过程都为日后工银瑞信顺利过渡到私有云打下了坚实的基础。
在应用虚拟化技术时,张轶和他的团队也经历了不少难题。比如在服务器实现全面虚拟化的过程中,他们发现异构计算平台的虚拟化要想实现未来灵活非配资源的目标是难以做到的,所以就将服务器尽量统一更新为基于英特尔E7处理器家族的IBM 3850 X5服务器,可根据自己的实际情况对目标工作负载进行自定义的配置。
在应用迁移的过程中,起初工程师们普遍认为要实现系统100%的虚拟化。但在实际操作时却发现问题很多,造成数据库效率、中间件效率低下,在切换的过程中难以保证数据完整性等,如果非要实现数据库虚拟化反而会增加系统的复杂度。经过反复实践,他们终于找到了虚拟化技术应用的平衡点。
解决基金公司快速成长的烦恼
工银瑞信的数据中心目前承载着90多套应用系统,目前超过2/3的系统都是运行在虚拟化环境中的。基金行业有一个特点,应用对IT资源的占用在白天和晚上有巨大的区别:白天交易密集,会占用大量处理器资源;晚上系统主要进行批处理类的操作,需要耗费大量内存。“虚拟化之后,我们可以更轻松的调配IT资源。非常简单就可以完成处理器、内存、存储在不同系统间的调配,资源的释放、回收可以完全实现自动化,管理压力就会小得多。”
张轶认为,用少量的人员管理全部基础设施,没有虚拟化技术的支撑是做不到的。随着计算技术的发展,以及金融业务对后台设备计算能力要求的日益提高,虚拟化技术在高可靠性、可用性上的优势明显,一旦物理机器出现故障可以随即迁移到另外一台机器上,而应用却不会停机,从而实现无缝应用迁移,只需点鼠标这样的动作即可完成。“可以说在虚拟化,尤其是从芯片这个角度来说,英特尔公司应该是没有什么竞争对手的,所以就必然选择了英特尔作为合作伙伴来进行虚拟化道路”,张轶解释到。
每年年底,都是基金行业的“战争期”,各基金公司争排名的时候,也是IT部门最忙的时候。从产品的提出到发行,一般时间只有2周,2周IT部门要完成系统的开发、测试、上线、部署等一系列工作。由于开发测试的时间一般很难压缩,张轶和其团队总是不得不想方设法压缩上线部署的时间。在规模化应用虚拟化技术后,数据中心实现了标准化的IT资源采购和分配机制,上线部署的时间也变成了按分钟计算。在张轶看来,虚拟化只是云的初级阶段。真正的私有云应该是一个集大成的结果,包含了对存储、计算、网络的虚拟化,对前端虚拟化,对应用的虚拟化,通过云发布出来的则是各种应用和服务。去年,工银瑞信进行了私有云应用的第一步尝试,将内部办公系统以云应用的方式发布到门户网站上。张轶暗示,如果一切顺利,未来他们还会继续尝试将生产系统搬到云中。