盘点数据库2013之一:数据分析崛起

文章讲的是盘点数据库2013之一:数据分析崛起,又到一年盘点时。在刚刚经历了“大年(新产品集中发布)”之后,2013年数据库市场依旧保持了快步发展的节奏。随着数据量的极速增长以及技术的完善成熟,企业对数据分析的需求达到了前所未有的高度,海量数据中蕴含的商业价值等待被挖掘。与此同时,云数据库技术以及数据库即服务(DBaaS)的出现让企业可以把更多基础架构运维的工作转移给服务提供商,而传统数据库管理员(DBA)的价值究竟如何体现,这是个问题。为此我们在本文中,将从多个角度为您总结数据库领域在过去一年中几个值得关注的话题。

  数据分析崛起 列式存储+内存分析引领“潮流”

  传统做交易数据库的厂商今年都忙着推出最新的分析型数据库,这是他们之前并不太关注的领域。事实上交易型数据库管理系统的技术复杂度与门槛要远高于分析型系统,对于这种厂商集体“向后转,齐步走”的行为,IBM的负责人总结的很好:数据分析市场的增长速度非常之快,客户对应用的需求已经从之前的记录系统(system of record)应用逐渐转向员工系统(system of engagement)应用。也就是说从交易型工作负载转移到了范围更广、发展速度更快的分析型工作负载。可以说分析已经无处不在。

  分析型数据库中的一个主要技术就是列式存储,将数据以列的方式存储在数据库当中,一方面能够对数据进行更深度的压缩,控制数据量同时减少I/O,提升数据分析性能。列式数据存储并不是什么新技术,在当年的Sybase IQ以及Vertica等数据库产品中已经得到了广泛的应用。在新一轮的数据分析浪潮当中,内存技术的崛起让列式数据库有了更广阔的发挥空间,压缩过的数据可以全部放到内存中进行分析,把数据库性能推向了极致。列式存储+内存分析在某种程度上已经成为新时代数据库技术的“标配”。

  IBM推出DB2 BLU技术,加速大数据分析

  今年对于DB2来说是不同寻常的一年,因为这个关系型数据库的鼻祖迎来了它“30岁的生日”。我们也专门为DB2策划了一个专题,回顾了它过去30年的发展历程。今年4月份,IBM推出了最新版的DB2 10.5数据库,其中增加了BLU加速器功能,让用户的目光再次聚焦在IBM的旗舰级关系型数据库之上。

  DB2 BLU加速器是一个压缩优化、内存优化的基于列式的数据库产品。在技术方面它的亮点主要包括:查询功能完全管道化(pipelining ),表扫描可以共享;数据忽略(Data Skipping)功能能够有效降低I/O;基于单指令多数据结构(SIMD)的矢量化(Vectorization );概率缓存取代传统LRU(Least Recently Used),经常被引用的数据块出现在内存当中的几率就越大。这一功能的背后还有更复杂的随机算法支持;“自动化工作负载管理”功能,IBM认为查询之间的资源争用是造成资源浪费的主要原因,这一功能让BLU加速器与传统DB2数据库相比在并发性上产生差异性优势。

  当然,DB2 BLU加速器也存在一些的限制和不足。通过与IBM技术人员的沟通我们发现,DB2 BLU加速器并不会自动化地区分哪些数据库表该用列式存储,哪些该用传统的行式存储,IBM认为数据库的负载变化是不好预测的,因此目前的技术还没有达到要求。另外DB2 BLU加速器目前还只是支持纵向扩展(Scale-up),也就是说基于单一服务器,这也影响了内存技术发挥其更大的作用。希望IBM能够尽快解决这一问题。

  Oracle“服软”,内存数据库选件挑战SAP神经

  虽然嘴上说与SAP HANA没有可比性,但明眼人都能看出来今年10月份推出的Oracle内存数据库选件(in-memory database option)是冲着SAP来的。目前大部分SAP的应用是跑在Oracle数据库上的,但谁也不能保证10年以后还是这样,因为SAP在大力推广他们的HANA数据库并且收到了不错的效果。就连数据库技术大牛Michael Stonebraker也预测未来Oracle会感受到来自SAP的压力。那么现在问题变成了,当Oracle也有类似产品,并且能够保证应用的无缝迁移时,客户会选谁家的产品?

  每次开大会,Oracle几乎都不会忘了吐槽SAP两句,今年的OpenWorld也不例外。但今年SAP没有再选择隔空喊话,而是直接把飞机开到旧金山上空“砸场”。SAP的史维学还特意录了视频欢迎Oracle加入内存数据库派对,开玩笑问为什么Larry花了4年的时间才醒悟过来HANA的路是正确的。那么Oracle的内存数据库和HANA相比究竟有哪些区别呢?

  首先Oracle内存数据库选件支持两种方式的数据存储格式,即传统的行式存储,以及新的列存储。针对同一个数据和表,Oracle内存数据库能够同时以两种格式进行存储,并同时进行更新(增删改)并保持一致。比如增加一行数据到一张表,以列格式存储的数据也会同步更新。对OLAP方面的性能提升无需多言,而且它删除了大量原来用于统计的索引,也间接提升了OLTP性能。此外,所有传统的Oracle数据库可用性功能在启用新的内存数据库选项时,都不会发生变化。应用也可以无缝运行在Oracle内存数据库选件上,这对于SAP应用的客户来说是非常有吸引力的。事实上,数据库平台的迁移会带来大量底层架构以及前端应用的变动,这是客户无法接受的。如果客户可以使用原来的技术同时又能保证未来系统对性能的需求,那么相信没有谁会想这么折腾。

  SAP HANA:体现的是平台价值

  SAP已经把HANA视为最重要的技术,而包括应用软件(Business Suite、HCM)、云计算以及移动等平台在未来都将围绕HANA进行构建。其优势在于它已经在列式存储+内存分析这条路上走了3年多时间,如果算上之前的Sybase IQ已经有十几年的时间,而包括IBM的DB2 BLU也只是刚刚发布,Oracle的内存数据库选件正式发布时间还未确定。虽然占比不高,但SAP HANA确实已经有一些上线的安装基础了,这确实是IBM、Oracle无法与SAP相比的地方。

  SAP认为,企业的系统核心、数据结构以及处理流程越一致,其ERP所能发挥的效能就越高。SAP在努力说服客户从Oracle迁移到HANA平台上,忽略底层技术的复杂性,更关注于最终实现功能的周期以及系统性能的提升。因为客户对新技术的抵触情绪是阻碍HANA进一步普及的主要原因之一,客户需要看到更多HANA成功案例,而SAP自己就是最大的证明,他们只用了一年的时间就将公司的BW、CRM和ERP系统迁移到了HANA平台上。

  今年五月份,SAP宣布Business Suite on HANA正式GA(general availability),预计到年底 Business Suite on HANA的目标客户将达到600以上。而SAP认为HANA还有很大的提升空间,比如接近实时的处理非常复杂的查询,以及更高的查询速度。另外SAP也与合作伙伴努力打造HANA生态系统,推出单一服务器的HANA一体机,比如HP的服务器已经支持12-48TB的DRAM;IBM也在x86架构服务器上为HANA提供了解决方案,通过独特的设计能够让HANA的性能发挥到极致;SAP还通过AWS为用户提供HANA one平台服务。在横向扩展(scale out)方面,SAP还实现了1万个CPU核心,250 TB数据的HANA集群部署。

  “SAP HANA不是无聊的数据库,而是企业未来创新的基础平台。”这是SAP想传递给客户的关键信息。扩展阅读:SAP HANA:凸显平台的价值

  微软SQL Server 2014主打内存OLTP

  虽然在企业级层面微软的数据库技术同上述三大厂商相比还有一定差距,但微软一直在努力缩短这一差距。在SQL Server 2012刚刚发布一年多时间之后,下一代数据库平台SQL Server 2014也即将问世。目前微软已经完成了第二版的社区预览,也正式版之前的最后一个测试版本,在明年年初SQL Server 2014就将迎来最终发布。

  与IBM、Oracle以及SAP不同,微软SQL Server 2014主打的并不是分析系统,而是利用内存技术提升OLTP性能。据了解,微软这一以“Hekaton”为代号的项目将正式更名为SQL Server内存OLTP引擎。微软针对在OLTP操作进行了大量的优化,这些操作将在内存中完成,能够在提升性能的同时,支持更大的读负载。与其他类似产品不同的是,SQL Server 2014的内存数据库功能将不依赖于昂贵的硬件,用户可以自行选择哪些数据库表放到内存里,哪些放在硬盘上。而像HANA这样的产品是完全基于内存的,需要购买成本较高的硬件设备进行支持。SQL Server 2014使用现有的硬件设备就可以充分利用微软内存数据库的优势。

  此外,SQL Server 2014还将与Windows Azure进行更紧密的集成,包括将Azure VM用作AlwaysOn高可用性组的副本,内置了Azure备份支持等。在列存储方面,SQL Server 2014也将推出新一代的xVelocity ColumnStore技术,它可以对数据进行持续加载,同时列存储索引能够让SQL Server在索引中对数据进行压缩,从而进一步提升查询性能。与之前的版本相比,SQL Server 2014可以在已有的列存储索引中对数据进行加载和删除操作。

作者:孙瑞

来源:IT168

原文链接:盘点数据库2013之一:数据分析崛起

时间: 2024-09-11 08:00:12

盘点数据库2013之一:数据分析崛起的相关文章

盘点中国2013行业数据量

说人类步入了信息时代,有个事情是非常重要的,就是物理世界的信息化,包括信息基础设施建设和数字化,紧接着就是如何将数字化的东西(数据)进行储存.传输.交换以及使用,这一脉络伴随着移动互联网,云计算.大数据以及各种各样智能终端的出现,显得也越来越清晰.很多人都已认可,我们可能来到一个工业革命之后,一个比我们想象地更加重要的变革时代,我们把它命名为产业互联网的时代.毕竟这一切都是互联网出现之后才发生的,无论是云,通过网络随需调用的计算资源:大数据,关联的可分析在线数据:还是各种智能终端,都要依托互联网

大数据史记2013:盘点中国2013行业数据量

说人类步入了信息时代,有个事情是非常重要的,就是物理世界的信息化,包括信息基础设施建设和数字化,紧接着就是如何将数字化的东西(数据)进行储存.传输.交换以及使用,这一脉络伴随着移动互联网,云计算.大数据以及各种各样智能终端的出现,显得也越来越清晰.很多人都已认可,我们可能来到一个工业革命之后,一个比我们想象地更加重要的变革时代,我们把它命名为产业互联网的时代.毕竟这一切都是互联网出现之后才发生的,无论是云,通过网络随需调用的计算资源:大数据,关联的可分析在线数据:还是各种智能终端,都要依托互联网

盘点数据库2012:大数据市场争夺白热化

大数据的价值已经逐渐被用户认可.作为新概念,大数据在给一些初创公司带来机遇的同时,也为大型的传统IT厂商提出了新课题,在远未饱和的市场中如何将自身的利益最大化?因此我们看到包括甲骨文.IBM以及微软在内的主流数据库厂商都纷纷发布了明确的大数据战略,甚至连英特尔这样和数据不太沾边的公司也都参与进来.大数据中蕴含的大商机是每个厂商都要抓住的机遇. 在这里我们就来回顾一下过去一年中,几大重点厂商所发布的大数据战略,看看他们之间到底有何区别,谁又能引领新的大数据时代? 甲骨文大数据平台浮出水面 甲骨文在

众多经典复出 盘点科隆2013值得期待的手游

科隆国际游戏展(gamescom)由创办于2002年的原莱比锡游戏展( Games Convention)发展而来, 2009年起正式移师科隆,是欧洲最大最权威最专业的综合性互动式游戏软件.信息软件和硬件设备展览,与美国E3游戏展,日本东京电玩展同称为世界三大互动娱乐展会.同时科隆游戏展也是德国唯一一个集中了游戏软件.硬件.娱乐设备.信息软件和设备的大型国际展会.每年都有大批软硬件厂商参加展览,是游戏厂商和欧洲玩家及媒体交流信息的主要平台.随着手游市场的扩张,国内外厂商也越来越重视手游领域,现在

关于access数据库2013版本数据问题

问题描述 在设计数据库时,属性的字符串类型只有shorttext和longtext,我用的是c#连接数据库,用的是OleDbConnection和OleDbCommand,但是在插入数据的时候,因为插入的数据是参数,所以用的是占位符的方式,但是设置OleDbType的时候,只有varchar和nvarchar想问这是兼容的还是需要怎么设置.另外,数据原本是byte类型,单苦于找不到,所以问一下,是不是这个数据库里没有这种数据类型了 解决方案 解决方案二: 快来人,教教我解决方案三: 你确定只有v

年末盘点:2013年科技界的赢家与输家

2013年的科技界起起伏伏,几家欢喜几家愁,赢家统治了整个行业,输家却急剧的衰落. 比如轻博客系统Tumblr被以11亿美元的价格收购,还有私密聊天应用Snapchat的迅速流行,并被Facebook看中,出价30亿美元收购.而谷歌公司借着谷歌眼镜的推出,也在今年再次引领了产业. 但是并非每个公司都有好的业绩,虽然他们也不断的推出创新产品,比如三星公司的Galaxy Gear智能手表,在市场的反应并不是很好. 2013年科技界的赢家 Twitter公司 Twitter公司在11月成功上市,相比2

盘点马云2013年以来围绕电商布局主要投资

据传,阿里巴巴很可能将在今年8月赴美上市,上市前夕,其投资并购动作愈加频密.据记者不完全统计,过去一年多时间内,阿里发起的投资达到26起,从物流.足球,到浏览器.传媒. 对此,市场声音两边倒,一说,这是因为阿里急于花光授信,提高IPO估值:二说,俗话说"凤凰无宝不落",仔细梳理这些看似杂乱无章的投资,在阿里电商生态中都能找到其合适的位置. A 引流 抢移动入口为PC到手机导流 在PC时代,阿里在电商领域有着不可超越的优势,在移动互联网时代,阿里需要将PC用户引导到移动端来.纵观阿里20

2013年的五大设计亮点大盘点

  年终岁末,正是盘点时.在看过了最佳产品.最佳可穿戴等等之后,让我们也来关注一个非常重要的一个领域,这就是设计.而这里将给大家盘点下2013年五大设计亮点. 1 扁平化.自从拟物化的设计风格出现了之后,疯狂地追随者们跟扎了鸡血一样停不下来.但是在2013年终于有人把这个风格给叫停了.感谢苹果 iOS7 牵头做了这个改变. 2 响应式设计.响应式设计的趋势2012年就已有苗头,但是在2013年进一步得到了发展.UI 会根据终端用户的偏好自动来调整.这在移动端的页面呈现上是十分重要的. 3 电脑之

2013年存储市场闪存厂商收购事件盘点

2013年,闪存搅动企业存储市场,伴随而来的就是存储厂商收购事件增多.下面我们盘点一下2013年的闪存厂商收购事件. 闪存初创厂商Violin收购SAN缓存设备初创厂商Gridron系统公司 纯闪存阵列初创厂商Violin Memory收购GridIron Systems公司,后者是一家供应TurboCharger SAN加速闪存高速缓存的初创公司.Violin主要为企业.公共事业客户市场提供共享6000系列纯闪存阵列,它还推出了单服务器PCIe连网的设备,并与富士通签订了阵列转售协议.Viol