详解Amazon Redshift

11月底,AWS推出了数据仓库服务Redshift,除了价格便宜,Redshift还有诸多特点,甚至你根本不需要雇佣数据库管理员。以下为James Hamilton对Redshift的评论:

快速 强大——Redshift有大量创新,提供非常高的数据请求性能,支持从几百GB到PB或更多。首先,它采用列式存储和压缩技术。第二,硬件对数据仓库进行优化,使用附加的本地存储和万兆网卡连接每个节点。最后,使用了大规模并行处理(MPP)架构,可以在不停机的情况下实现扩展或收缩。

扩展性——有两种节点类型可选,一种为特大节点(XL),拥有2TB的压缩存储空间,另一种为8倍特大节点(8XL),拥有16TB压缩存储空间。起初,你可以从1个特大节点起步,最大扩展到总共100个8倍特大节点的集群。特大节点集群可拥有1到32个节点,8倍特大集群可以拥有2到100个节点。

通过AWS管理控制台或API,可以轻松的调整节点数量,并且这一过程不需要停机。目前Redshift处在有限预览阶段,并不支持调整重新设定空间,正式版将提供这一功能。

高性价比——你可以选择按需付费或长期合同,或通过保留实例获得更低的价格。在按需付费方式下,2TB的数据仓库的价格为0.85美元/小时,价格节点数量随扩展线性增长。保留实例的价格为0.228美元/小时,折合每年1000美元/TB。

全方位管理——Redshift对所有的设置、运维、扩展进行管理,贯穿数据仓库从建立到集群备份,以及安装补丁或升级。所有这些耗费精力的操作都交由Amazon来处理。

安全——Redshift支持SSL加密,可通过网页界面对访问数据仓库网络的防火墙进行设置,并支持在数据仓库集群中创建用户。当Redshift正式发布后,计划支持静止数据加密(encrypting data at rest)和Amazon虚拟私有云(Amazon VPC)。

可靠性——所有写入节点的数据,都将自动的在集群内的节点进行备份,并不间断的在S3进行备份。Redshift对集群的健康持续关注,并自动替换任何组件。

兼容性——Redshift通过了JasperSoft和Microstrategy认证,可以使用PostgreSQL JBDBC或ODBC将SQL客户端或智能工具与Redshift数据仓库连接。

写在最后

毫无疑问,对于价格敏感的用户,Redshift的吸引力足够强大。但我还是会问许多问题?数据安全如何保证?S3仅能提供99.9%的可用性,与金融行业的标准相去甚远。今年和去年频发的宕机,让许多AWS用户心有余悸。有些充满智慧的用户摸索出一套跨可用区备份的经验,能大大提高可用性,但这需要几年时间进行摸索、试错和优化。对于计划尝鲜Redshift的用户,首先需要在本地保存好数据,并准备一只强大的运维队伍以及足够的宽容心。

(责任编辑:蒙遗善)

时间: 2024-11-03 02:23:50

详解Amazon Redshift的相关文章

深度丨详解 Amazon Go 三大核心技术

12 月 5 日,亚马逊发布 Amazon Go 震惊业界.雷锋网第一时间研究了专利文件,并采访资深计算机视觉算法工程师,最终出文从2份专利文件,一窥Amazon Go到底藏了什么黑科技?  今天雷锋网特地采访了无人零售商店创业者陈维龙(微信:daoyuan3)为大家更加详细地解读 Amazon Go 以及无人零售商店项目.陈维龙毕业于中山大学,曾亲自参与并实施过多套类似的无人零售解决方案系统,对整个项目的流程化体系有着较深的认知和实践经验. Amazon Go 系统构成 陈维龙把 Amazon

详解 Amazon Go 三大核心技术

  12月5日,亚马逊发布 Amazon Go 震惊业界,我们第一时间研究了专利文件,并采访资深计算机视觉算法工程师,最终出文从2份专利文件,一窥Amazon Go到底藏了什么黑科技? 今天特地采访了无人零售商店创业者陈维龙为大家更加详细地解读 Amazon Go 以及无人零售商店项目.陈维龙毕业于中山大学,曾亲自参与并实施过多套类似的无人零售解决方案系统,对整个项目的流程化体系有着较深的认知和实践经验. Amazon Go 系统构成 陈维龙把 Amazon Go 系统"拆分"为三部分

Laravel 5.0 发布 新版本特性详解

 这篇文章主要介绍了Laravel 5.0 发布 新版本特性详解,本文讲解了目录结构.Contracts.路由缓存.路由中间.控制器方法注入.认证脚手架等新特性,需要的朋友可以参考下     译注: 期待 Laravel 5.0 已经很久很久了, 之前跳票说要到今年一月份发布. 从一月份就一直在刷新官网和博客, 始终没有更新的消息, 前几天终于看到官网文档切换到了 5.0 版. 新版本带来了众多令人激动的新特性, 尤其是定时任务队列和表单请求两个特性, 光看一下更新说明中的简单介绍都忍不住要上手

AJAX核心对象-- XMLHttpRequest 对象使用详解 (一)

ajax|request|xml|xmlhttprequest|对象|详解 多数 Web 应用程序都使用请求/响应模型从服务器上获得完整的HTML 页面.常常是点击一个按钮,等待服务器响应,再点击另一个按钮,然后再等待,这样一个反复的过程.有了 Ajax 和 XMLHttpRequest 对象,就可以使用不必让用户等待服务器响应的请求/响应模型了. 本文中,Brett McLaughlin 介绍了如何创建能够适应不同浏览器的 XMLHttpRequest 实例,建立和发送请求,并响应服务器. 本

深入理解JavaScript系列(21):S.O.L.I.D五大原则之接口隔离原则ISP详解

 这篇文章主要介绍了深入理解JavaScript系列(21):S.O.L.I.D五大原则之接口隔离原则ISP详解,本文讲解了JavaScript接口.ISP与JavaScript.堕落的实现.静态耦合.语义耦合.可扩展性等内容,需要的朋友可以参考下     前言 本章我们要讲解的是S.O.L.I.D五大原则JavaScript语言实现的第4篇,接口隔离原则ISP(The Interface Segregation Principle). 英文原文:http://freshbrewedcode.c

《开源容器云OpenShift:构建基于Kubernetes的企业应用云平台》一3.2 核心组件详解

3.2 核心组件详解 OpenShift的核心组件及其之间的关联关系如图3-2所示.OpenShift在容器编排层使用了Kubernetes,所以OpenShift在架构上和Kubernetes十分接近.其内部的许多组件和概念是从Kubernetes衍生而来,但是也存在一些在容器编排层之上,OpenShift特有的组件和概念.下面将详细介绍OpenShift内部的核心组件和概念. 3.2.1 Master节点 在介绍Master节点前,我们先补充一些内容.OpenShift集群可以由一台或多台主

ejb-有没有EJB JPA数据库持久层开发实践详解的源代码,麻烦给一份

问题描述 有没有EJB JPA数据库持久层开发实践详解的源代码,麻烦给一份 解决方案 书籍网上有好多下载的,源代码没有,建议你可以从这里,买一份,光盘里有源代码http://www.amazon.cn/dp/B001B8RVAW

App域名劫持之DNS高可用 - 开源版HttpDNS方案详解(转)

  http://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=209805123&idx=1&sn=ced8d67c3e2cc3ca38ef722949fa21f8&3rd=MzA3MDU4NTYzMw==&scene=6#rd 主题 开源 本文根据冯磊和赵星宇在"高可用架构"微信群所做的HttpDNS智能缓存库原理整理而成,转发请注明来自微信公众号ArchNotes. 冯磊,目前主要从事手机应用平

Java 8 中的 Streams API 详解

为什么需要 Stream Stream 作为 Java 8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream 是完全不同的概念.它也不同于 StAX 对 XML 解析的 Stream,也不是 Amazon Kinesis 对大数据实时处理的 Stream.Java 8 中的 Stream 是对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利.高效的聚合操作(aggregate operation),或者大批量数据操作 (