统计数据被喻为国家“战略金矿”,而中国国家数据统计由于采用了国家、省、地、县、乡、村六级系统,在相当长的一段时间内无法实现全国统一的统计平台。近年来,统计局着力通过IBM的小型机打造核心业务系统建设,一个覆盖全国、随需扩展、统一业务的“统计云”正初现规模。
据国家统计局数据管理中心主任许剑毅介绍,国家统计局的应用系统是一个庞大的系统。首先,处理信息量很大,可以说是海量数据,除了常规收集社会经济发展信息以外,还有一些大型的国情国力调查。其次,统计数据的时效性很强,除了年报还有很多月报。这也造成了数据的高并发性特征。
许剑毅表示,“从硬件的处理能力来看,大型主机当然适用,但主机系统开销太大,对于国家统计局这种并非直接产生效益的部门来讲,一定要选择性价比更为突出的硬件设备。”为此,国家统计局数据管理中心在核心业务系统的硬件核心中选择了小型机,并在二期工程中购入了包括4台最新的IBM POWER780在内的小型机。
“我们的思路是用小机器代替大机器的作用,把小的机器通过集群的方式,集群到核心业务系统来满足业务需求。”许剑毅表示。与此同时,建立一个全国各级统一的系统也是国统局需要解决的,“统计云”就是按照这样的需求提出来的。
目前,国家统计局数据管理中心在“统计云”核心业务系统形成了四大资源池:Web服务器资源池、应用服务器资源池、数据库服务器资源池和存储资源池。存储资源池采用了统一的存储,实观了对老旧设备的统一管理。数据库资源池通过IBM基于POWER小型机的虚拟化技术实现了整个数据库的资源灵活调用。应用服务器根据应用的不同选择了异构架构,包括IBM POWER小型机,同时也选用了其他品牌的小型机和PC服务器,组成虚拟化的应用服务器的资源池。异构原理是通过负载平衡来实现的,每个资源池之间通过防火墙以及其他安全手段实现了隔离。
据统计局数据管理中心王洪琛处长介绍,数据库资源池中一共由两台IBM Power595和四台IBM Power780构成,通过IBM虚拟化技术,整个资源池可以在满足现有应用横向扩展需求的同时,将对整个系统硬件资源分配进行调整,在不影响人口普查与企业联网直报两大业务的前提下,配置部分资源用于新增的其他业务。
“基础架构云中,数据库云是通过Power来实现;应用服务器云一个通过IBM的应用服务器,以来应对大并发的应用,IBM Powre595和IBM Powre780发挥了很好的作用,Web服务器云采用的都是刀片式服务器。基于x86的应用服务器也会支撑一些非关键业务的发展。”王洪琛表示,无论是哪种云、基于哪种架构的,所有的都是冗余性的,会最大限度保证业务的高可用和持续性。
许剑毅指出,系统整个设计之初是按照百万级高并发量设计的,“利用虚拟化、云计算这些技术百万级不会是问题,甚至可以达到千万级。”许剑毅认为,该套系统也较好地发挥了IBM小型机练级处理高并发的能力,人口普查就很好地检验了这套系统,“整个系统的协调、运算能力非常强。”许剑毅称,之前13亿多人的表格单机处于需要一天甚至更多的时间,而基于新的系统,两分钟可以搞定。
对于统计局未来信息化发展,许剑毅表示,推进统计系统“一网 、一台、一库”建设将成为重中之重。其中,“一网”指从统计局计算中心到地级市县,建立统一网络,构建信息高速公路;“一台”是指构建统计网络系统核心业务处理平台,保证全国统计业务平台统一集中;“一库”则是统计数据大集中,建立统一集中的数据库。数据大集中使统计数据采用统一标准,统一管理,统一计算,从而使统计的数据结果更具有科学依据。
现在,国家统计局数据处理中心正在开发全国的统一数据处理的应用平台,建成后,中心将集中全国的统一业务,使得核心业务系统可以为整个统计工作提供云服务。这样,企业在全国任何一个地方登录这个平台,都可以完成企业的报送任务。同样,一个基层的统计人员登录这个平台后,可以看到他所管辖的这些企业的报送情况,并及时发起催报和数据审核工作。这意味着,每个人在这套系统中都有惟一的身份,从而确定了相对应的管理权限。核心业务系统将彻底改变过去系统建设分散、系统不统一、机房建设浪费等状况,为整个统计局的业务处理提供一个云服务。未来,企业联网直报将从现在的百万级别提高到千万级别,核心业务系统也将整合更多的数据和应用。
国家统计局数据管理中心主任许剑毅表示:“这套系统从硬件到软件都采用了最新的技术。目前这套系统的北京节点已经建立好,全国包括北京在内将一共建立五个节点,未来工作人员无论在哪个地区登录,只要进入这个系统,就将按照自己的角色去完成自己的工作。”