本文讲的是专访卢东明:Sybase IQ专注大数据分析,常常听到这样一句话:关系型数据库不适合做数据分析。Sybase中国技术总监卢东明对这一观点做出了明确的回应:Sybase IQ是个例外。Sybase IQ之所以能够在数据分析领域占得先机,源于它独特的列式存储结构。相比于传统的行式关系型数据库,Sybase IQ对商业信息的访问速度能达到百倍甚至千倍。
近几年,大数据日渐火爆,数据呈现非结构化趋势,据Gartner统计,数据中有80%是半结构化或非结构化数据。因此,如何应对大数据的新挑战成为数据库厂商面临的一大难题,对此IT168记者采访了Sybase中国技术总监卢东明先生,针对大数据这一热点话题进行深入探讨。
▲Sybase中国技术总监卢东明
Sybase IQ的大数据视野
随着存储价格越来越低,企业开始有能力将大量历史数据收集并进行分析。与此同时,计算能力的不断提高,如分布式技术和硬件能力的提升使大数据分析成为现实。在这种环境下,各大数据库厂商纷纷推出基于大数据的产品,因此2012年也被人称为大数据之年,但卢东明认为现在说大数据之年为时过早,方法论、工具和数据规模都不能明确,因此大数据才刚刚开始,还有很大的发展空间。
中国是大数据分析的尖端地区、领先地区,是一个巨大的市场。卢东明表示中国的电信行业是全球领先的,从用户数来看,是世界上任何一个国家都比不了的。这就如同华尔街在金融界的地位一样。如果需要对中国的电信用户进行行为分析,数据量的规模将相当庞大。另外,数据分析的速度和分析的复杂度都将是数据库厂商需要关注的问题。
就如同ITPUB创始人黄志洪在Sybase IQ 15.4发布会上的谈话中所介绍的,数据分析面临的三大问题。首先,数据日趋庞大,无论是入库还是查询,都出现性能瓶颈。其次,用户的应用和分析结果呈整合趋势,对实时性和响应时间的要求越来越高。最后,使用的模型越来越复杂,计算量指数级上升。Sybase IQ就是针对这些问题推出的一款产品,是极具预见性的大数据产品。
在大数据领域,Sybase IQ一直走在前列。Sybase IQ虽然也是关系型数据库,但它与其他关系型数据库有很大的区别,其中最重要的便是Sybase首创的列式存储技术,名符其实的列式数据库。面对数据库市场上很多以“列式”命名的技术,如Oracle提出的列式压缩、微软SQL Server的列式存储索引,或是Teradata提出的类似术语,卢东明表示,列式存储、列式存储索引、列式压缩和列式数据库是完全不同的概念。正因为看到了列式数据库的强劲势头,老牌行式数据库厂商才开始推出类似产品。但是Sybase在列式数据库领域的专利地位和专注程度是其他数据库厂商不能企及的。
作者:王玉圆
来源: IT168
原文标题:专访卢东明:Sybase IQ专注大数据分析