【TechTarget中国原创】我们所熟悉的哈索博士(Hasso Plattner)经常被称为是SAP HANA之父,但在HANA背后其实还有一个人,是他与哈索共同完成了HANA的最初设计,这个人就是亚历山大.蔡尔(Alexander Zeier)。蔡尔曾在SAP公司和哈索博士研究机构长期任职,在此期间,他还与哈索博士共同出版著名的《内存数据管理》一书,被称为是内存数据库系统的最权威书籍。
SAP HANA设计师
蔡尔目前的研究方向包括实时数据分析、预测分析以及大数据等。两个月以前,蔡尔离开了麻省理工客座教授的职位,选择加入了埃森哲公司,担任内存解决方案的全球总监。TechTarget记者有幸对蔡尔进行了专访,让他来谈一谈对内存计算的看法,以及当初在进行HANA设计时的一些轶事。
蔡尔透露,当初他的工作是与SAP最大的客户一同搭建HANA设备:“最早是和哈索博士一起为高露洁公司搭建一个原型系统,他们拥有全球最大的SAP系统之一。在使用HANA之前,连接关系型数据库进行2.8亿个单据处理的速度是20分钟,而使用HANA之后,我们只用了1.5秒。”
这个原型系统是在5年之前搭建的,蔡尔表示,现在的HANA系统,95-99%的响应时间都是不到1秒钟的。
事实上,这样的性能改善主要源自于英特尔的技术,他们在不断改进内存与处理器核心之间的数据吞吐速率。蔡尔介绍,当构建第一个HANA系统的时候,那时候的英特尔处理器的最大数据吞吐速度是每秒5-6个GB,而现在已经达到了上百GB的速度。将近20倍的性能提升,意味着HANA在相同的时间里能够处理更多的数据,查询速度将实现质的飞跃。
蔡尔介绍,HANA还使用了并行编程技术来实现多列数据的同时处理,所以随着处理器核心的不断添加,HANA还能实现查询性能的线性提升。每个处理器核心在1毫秒时间内能够处理的数据是2 MB,考虑到每个硬件配置中的刀片服务器能够使用80个处理核心,蔡尔相信HANA在未来的扩展空间还是非常大的。
那么,具备如此强大性能的HANA内存设备,企业该如何使用它来为业务服务呢?蔡尔表示,HANA可以被视为企业业务流程创新的一个基石。人类的思维反应速度是700毫秒,HANA的处理速度基本上可以赶上人类大脑的速度,也就是说基于HANA的应用可以视为是即时的。比如,金融机构可以使用HANA来进行实时的风险预测。
关于内存数据库的争论
目前业界有些声音认为,像HANA这样的内存数据库技术只适合一些大型的跨国企业,他们的数据量非常多,当然“钱包也非常鼓”。蔡尔表示并不同意这样的说法。
他认为,HANA在数据中心计算层面的成本是相对较低的,现在花10万美元可以买1TB的内存计算能力。另外,关于内存数据库设备是否是专有的问题,蔡尔表示HANA是开放的。它的硬件架构是基于英特尔x86处理器的,包括思科、IBM、HP等在内的硬件合作伙伴都会为HANA系统提供支持。
蔡尔介绍,HANA的底层操作系统是SuSE Enterprise 11 Linux。但要改进性能,HANA还涉及了更低级别的编程语言,来对英特尔处理器Level 1、2、3的cache进行优化。
IT技术的未来
商业计算始于大型机,然后逐渐转向CS计算。蔡尔认为,内存处理将主宰未来的计算时代,如果说SAP R/2代表了主机时代,SAP R/3代表了CS架构时代,那么未来的R/4就将是由HANA来充当主角。
从刚刚结束的SAP TechED大会可以看出SAP将主推HANA作为核心企业应用的底层数据库。蔡尔透露,在2006年最初开发HANA的时候,它就是可以作为单一的数据源来进行交易和分析系统的处理。
尽管有段时间,SAP已经将HANA主要定位在商业分析领域(集成SAP 360 CRM),但是可以看到现在已经回归最初的定位。也就是说,HANA会是一个支持交易和分析混合负载的内存数据库设备。
TechTarget中国原创内容,原文链接:http://www.searchdatabase.com.cn/showcontent_68499.htm