AWS近日发布了数据仓库服务Redshift,这是近段时间最大的新闻。Redshift是一个基于云的数据仓库服务。不过针对这项服务,也让别人产生了很多疑虑,云计算是数据仓库最好解决方案吗?
总所周知,AWS一直在努力的实现数据的高效管理,云计算也是一个可以帮助企业实现一个低成本的基础设施搭建,之后能更好的对网站进行管理。但是云计算里的公有云好像阻碍了Redshift前进的道路,迄今为止,还是有很多人不太愿意将自己敏感的财务数据或者是个人身份资料放到云端,认为那并不安全。而且如何把数据迁移到云端这也是一个很大的难题,还没有得到解决。
这也是实现云端的数据仓库的最大挑战:如何把数据迁移到AWS的云端。这些TB级甚至是PB级的数据在迁移到AWS云端的过程中,不仅仅只是安全性问题,甚至有可能耗尽带宽。不过AWS连接着第三方的供应商网站就像Equinix,就可以直接连接到云端。AWS的官员表示通过“shipping service”传输物理磁盘上的数据是一种很常见的方式,这也有利于用户在AWS上获取和发送数据。
当然,数据迁移到云端和那些已经在AWS云端的数据是不一样的,这种情况多数是初创公司,他们一开始就把一切部署到AWS这个平台之上。在本次大会的第二天,AWS就释放了一个千兆链接的数据通道来帮助用户实现数据的迁移工作。但是许多企业已经拥有了自己的数据仓库,很难考虑这项服务,当然也不排除他们也会在Redshift上测试新的数据仓库服务。Wikibon项目的大数据研究员Jeff Kelly暗示,如果公司拥有敏感的信息如财务数据或个人身份资料等等的话,那么可能还需要一段时间来做决定。
优势在于成本,让企业专注于核心竞争力
Redshift最大的优势在于成本低廉。亚马逊对Redshift在Amazon.com上的零售业务上已经进行了测试,结果表明每年的成本仅仅是32000美元,对比老牌玩家“百万美元”级别的数据仓库,Redshift无疑是一个很好的选择。传统的数据仓库的应用软件的花费在19000美元到25000美元之间(G/每年),而在Redshift上只需要1000美元(G/每年)。
AWS首席数据科学家Matt Wood认为,对于大公司来说,这是一个潜在性的成本节约,更重要的是Redshift消除了构建数据仓库的“壁垒”,让中小型企业构建数据仓库变成了可能。与此同时他表示,Redshift和其他的AWS服务可以让企业更专注于自己的核心业务,而不用耗费太多的精力来管理基础设施。
Matt Wood:“Redshift旨在消除那些大规模的基础设施对企业的拖累,进而可以让企业专注于自己核心的竞争力。”