从VCD到DVD,从U盘到手机,什么热就做什么,这种一窝蜂现象是很多国内中小企业发展的写照。而南京斯坦德公司在转型时却逆向思维,避开热门技术。在斯坦德选择InfiniBand时,InfiniBand还曲高和寡,鲜为人知。然而,在大数据、云计算、绿色IT成为产业趋势的今天,当年的冷门技术已经变得炙手可热。
虽说Mellanox在IT市场上不显山显水,但在高性能计算(HPC)领域,这家服务器与存储端到端连接解决方案供应商却大名鼎鼎。其高速互连技术不仅在全球超级计算机前10强中有50%在使用,还成全了全球500强中系统效率最高的超级计算机。
4月10日,这样一家“高大上”的公司却与进入IT市场仅3年的斯坦德联手,共同打造全球首个CloudX架构云计算体验中心。
转型之策
在国际云计算咨询委员会2014中国云计算峰会现场,作为承办方的斯坦德董事长胡永生,向本报记者娓娓道来斯坦德的转型之路。
1989年,怀抱着实现知识价值的理想,胡永生下海创业。闯荡多年后,最终还是失败了,用胡永生的话说,这次创业失败,经验积累谈不上,收获的是很多的教训。
到了1997年,企业开始转型通讯服务,主要的合作伙伴是摩托罗拉。时至2008年,摩托罗拉手机业务与电信设备业务闹着分拆,与此同时,胡永生日益感受到来自市场的压力:通讯服务市场门槛越来越低,但人工成本却越来越高。
于是,胡永生又萌生了转型的念头。与第一次在市场上打拼收获的只有教训不同,胡永生坦言,此番跟摩托罗拉的合作,从中学到了很多。作为美国首届国家质量大奖的获得者,摩托罗拉质量控制体系和技术研发,都给胡永生留下了深刻的印象,当然,最大的收获还是跟摩托罗拉合作中在通讯服务上学到了很多,也积累了丰富的服务经验。
伴随着物联网的兴起,胡永生借势进入IT领域,2000年落户在位于南京城区的江苏省白下高新技术产业园区,从事物联网平台的研发。
刚刚进入IT市场的胡永生,很快就体验到来自IT市场的孤独,“我们在IT市场是新兵,完全没有用户积累,而热门领域已经挤满了厂商。”
IT市场远比通信市场开放,市场门槛更低;由于技术的成熟,热门市场的竞争不仅白热化而且品牌集中化的现象日益强化。进入这样的市场,对于德斯坦来说,无异于刚脱离了通信服务市场的“狼窝”,又掉进IT热门市场的“虎口”,企业转型就失去了意义。
“最终,我们选择了大家都不太注意的InfiniBand市场。高端市场做得人很少,这样,我们才能跟人家站在起跑线上。”胡永生说。斯坦德成为Mellanox的中国总代理,而Mellanox是全球领先的InfiniBand技术供应商。
随着处理器性能不断提高,现有的系统输入输出PCI总线的带宽和延时逐渐成为制约服务器之间或者服务器之间数据传输的瓶颈,于是,新一代系统I/O架构InfiniBand协议应运而生。
当前,集群架构已经成为HPC市场的主流,集群节点间的网络带宽与延时是影响整个HPC系统性能两个关键因素,因此InfiniBand技术理所当然地首先被HPC这一高端的窄众市场所接收。
一拍即合
HPC顾名思义,就是以计算的高性能为追求目标的。早期的HPC主要用户是美国与核武器研究相关的国家实验室和大学,HPC的体系架构是为特定应用进行优化的。由于市场极窄,没有商品化的系统,这就迫使用户自己来研发HPC的体系架构。
在HPC领域,这些非IT专业人士做的甚至比IT专业人士更好,2007年,美国最大的核武器系统研究机构桑迪亚国家实验室在其网站首页上写道,其HPC体系架构授权给克雷公司。克雷公司曾是巨型机市场的霸主,在超级计算机500强最新排名中,克雷的系统位居第二。
江苏省计算机学会HPC专委会主任委员、南京大学地球科学与工程学院周会群教授就是这样一个非IT专业人士,他的专业是地球物理。
继实验和理论之后,计算技术已经成为科学发现的第三范式,因此,HPC日益成为科学研究甚至是工业界创新的重要工具。在HPC从专用走向通用的过程中,集群架构与Linux逐渐取代昂贵的并行架构,成为HPC的主流。
周会群就是早期集群架构应用的探索者这一。早在1994年,在美国工作的周会群便在自己家里搭建了一个集群系统,来处理他的专业应用,“当时,并行系统非常贵,只有大学和政府资助的研究机构才用得起。而集群系统被称为是穷人的超级计算机。”周会群说,“得益于Linux的兴起,个人才有能力搭建集群系统,在系统搭建过程中,需要对硬件进行优化,对系统软件进行裁剪,因而积累了很多经验。”
2003年回国前,周会群还在硅谷做过几年HPC方面的研发,也看到了众多技术创新的新兴企业。
周会群回到母校南京大学后,依旧从事着他的地球物理方面的研究。此时的地球物理研究,对于HPC计算性能的需求或许用“贪婪”才能形容。
被推举为江苏省HPC专委会主任委员后,除了地球物理和HPC外,周会群还经常琢磨着为企业做些什么。“专委会得到一些企业的资助,要想着怎么从技术上回馈企业界”周会群说。
伴随着云计算的兴起,各地竞相建设数据中心,当数据中心建成后,人们才发现除了建设成本的昂贵外,运营成本同样高昂,单是每年耗电就是一个惊人的数字。
“数据中心的耗电主要来自服务器,而服务器中CPU又是耗电大户”周会群说。“InfiniBand的低延时主要是靠RDMA(远程直接数据读取)技术实现,它可以绕过CPU,远程直接读取数据。”
“绕过CPU”意味着RDMA工作时,CPU这个耗电大户是不工作的,或者说当服务器之间或者服务器与存储器之间进行数据通信时,CPU是闲置状态,耗能将会大幅降低。
HPC领域更为看中的InfiniBand的低延时,而产业界尚不清楚InfiniBand在数据中心节能上的巨大潜力。对于InfiniBand了然于胸的周会群知道商机来了
于是,周会群跟国内顶尖的两家服务器厂商谈了自己的设想,但是对方都认为InfiniBand曲高和寡,兴趣不大。
2011年10月,周会群与胡永生在济南举办的全国高性能计算学术年会上碰面,双方一拍即合。做了Mellanox代理业务的胡永生心里明白,InfiniBand市场看似窄小,但其潜在的市场空间非常大,只是没有启动而已。
周会群的兴趣还是在地球物理上。因此,他只是在斯坦德做了兼职的首席科学家,利用业余时间来帮助斯坦德。
用实力证明自己
“周教授对技术非常熟悉,他提供硬件底层和软件优化方案,特别是Linux的定制化;斯坦德有七八十人的技术团队来实施,我们在实验室上投资了1千多万。” 胡永生说,
得益于周会群十多年的技术积累和斯坦德技术团队之前在InfiniBand代理和测试上的技术积累,项目进展得很快,经过半年的研发和测试后,当年9月,在“云桥”系列产品技术和设计定型专家评审会上,来自中科院、工程院、高校的专家给予云桥系列产品高度评价:该系列产品实现了云计算、物联网和移动互联网等技术体系中大数据高效传输和存储技术的重大突破,整体性能达到国际先进水平。
“我们还把产品拿到泰尔实验室做测试。”胡永生说,“我们的产品在输入输出效率上远远超过市场上的高端产品,而价格只有EMC的一半。”
尽管产品性能与价格都颇有竞争力,但胡永生依旧有些犯愁:“IT用户不知道斯坦德,而斯坦德在IT领域也没有用户积累。”
为了突破市场瓶颈,斯坦德不断寻找机会与IT厂商PK。中原某省移动分公司要上一个涉及到3000万上网用户数据分析的云计算项目。斯坦德听说后,就把自己的一体机送过去免费试用。斯坦德副总经理兼CTO储浩,该系统不仅全面满足用户的需求,而且用户表示,与沿用国外小型机方案相比,项目成本降低了90%,能耗降低了80%,每年节电约26万千瓦时。
今年4月初,南京市信息中心结束了对斯坦德提供的基于云桥存储器的存储虚拟化平台为期1个月的测试,总计12项检测,全部合格。测试报告认为:在斯坦德云存储环境下,VMware性能高于FC(光纤通道)存储环境下测试值,符合南京信息中心业务需求。而FC存储可是当今高端存储的代名词。
除了与国际IT厂商同台竞技外,斯坦德又采用互联网思维,在公司内搭建平台,让用户把自己的应用放上面免费体验。用就要让用户有最好的体验,为此,斯坦德又与Mellanox合作,基于Mellanox的云计算架构CloudX,搭建了云计算平台。于是就有了本文开头的那一幕。