Cassandra 2.0:下一代大数据轻松从关系型数据库迁移

  2008年,">Facebook送给大数据用户一个礼物。社交巨头开源了Cassandra——NoSQL大数据分布式数据库。今天,随着Cassandra 2.0的问世,这个礼物也显得愈加珍贵。

  自从2008年以来,在Apache软件基金会(ASF)的指导下,Cassandra已经变得更强大更高速。今天,据Apache基金会称,“Cassandra可以快速且可靠地应
对大规模数据集,而不会折损性能,不管是运行在云中,还是部分预置在混合数据存储库内。它是一个完全分布式的架构,提供容错特性以确保应用不会中断,其线性可扩展性可以每秒处理数千个请求”。

  Apache Cassandra副总裁Jonathan Ellis发表声明称:“在
五年内,Apache Cassandra已经成长为全球使用最广泛的NoSQL数据库,并作为如今很多最为流行的应用的支撑。”

  凭借着像eBay、Reddit和Twitter这样的高端用户,Cassandra既可以处理大数据,又不牺牲性能。Cassandra最大的用户可不能接受糟糕的数据性能。

  最
新的Cassandra 2.0版本包括多项新特性。据Ellis表示,最主要的升级是“Cassandra 2.0让开发者可以更
轻松地从关系型数据库迁移出来并快速提高生产效率。”

  更具体地说,
新功能和改进包括:

  - 轻量交易可以确保类似关系型数据库提供的序列化隔离级别的操作线性一致性,
防止并行请求之间发生冲突

  - 触发器可以将性能关键代码推动到接近它所处理的数据的地方,简化与Storm这样
事件驱动型框架的集成

  - CQL(Cassandra Query
Language)增强游标等功能,加强了索引支持

  - 如果初始查询占用了太
多时间,可以通过发送冗余请求到其他副本,重新尝试避免查询超时

  - 定制的Thrift服务器部署,基于LMAX Disruptor,一个高性能线程间
讯息库,可实现更低的讯息处理延迟,通过灵活的缓冲分配策略提高吞吐量

  新版本Cassandra从本周三开始提供下载,与其他所有Apache项目一样,Cassandra 2.0也是免费的,是Apache 2.0下的许可。

时间: 2024-08-01 07:14:26

Cassandra 2.0:下一代大数据轻松从关系型数据库迁移的相关文章

大数据-怎么统一关系型数据库,非关系型数据库,文件类型以及消息类型(如网页)的接口

问题描述 怎么统一关系型数据库,非关系型数据库,文件类型以及消息类型(如网页)的接口 最近接了个需求,就是要统一如题的各种接口,小弟从来没做过类似的东西.希望各位能给点例子. 解决方案 可以考虑工厂模式和适配器模式

如何构建下一代大数据架构——数据湖

如何创建一个适用于多样数据类型,并可扩展的敏捷数据平台?答案就在数据湖中! 图片源于网络 技术和软件的进步使我们能够处理和分析大量数据.虽然很明显,大数据是一个企业投入了大量资金的热门话题,但要注意,除了考虑数据规模,我们还需要考虑到被分析数据类型的多样性.数据种类不同意味着数据集可以存储在许多格式和存储系统中,每个类型都有自己的特征. 考虑数据多样性是一项艰巨的任务,但有一种方法可以使你360度全面了解你的客户,提供商和运营商.为了实现这种方法,我们需要实现下一代大数据架构.接下来,我们来看一

英特尔段建钢:Spark将成为下一代大数据的标准

Spark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析.Spark由加州伯克利大学AMP实验室Matei为主的小团队使用 Scala开发开发,其核心部分的代码只有63个Scala文件,非常轻量级. Spark提供了与Hadoop相似的开源集群计算环境,但基于内存和迭代优化的设计,Spark在某些工作负载表现更优秀. 9月18日,在长沙举办的第九届政企信息化策略研讨会中,来自英特尔的高级技术经理段建钢带来了"大数据技术发展剖析"的主题演讲.Hadoop改变了处理数据方

欢网科技发布智能导视2.0 利用大数据推送内容

 3月24日消息,今日,智能电视服务商欢网科技发布新产品智能导视2.0,利用大数据分析,主动向用户推送感兴趣的内容.相较于智能导视1.0,智能导视2.0主要是部分功能进行了优化. 在直播推荐方面,智能导视2.0基于大数据的热播节目收视排行和电视群体的用户画像进行校准,通过内容.用户的标签化,实现个性化匹配:在信息及频道的深度运营方面,在用户看广告或换台的时候,可以参与互动活动,让用户不换台或最先选择你喜欢的频道:在内容聚合方面,智能导视2.0升级了点播.回看内容的聚合,回看节目点播化,同时提供节

大数据管理系统:NoSQL数据库前世今生

文章讲的是大数据管理系统:NoSQL数据库前世今生,NoSQL一词最早出现于1998年,它是Carlo Strozzi开发的一个轻量.开源.不提供SQL功能的关系型数据库(他认为,由于NoSQL悖离传统关系数据库模型,因此,它应该有一个全新的名字,比如"NoREL"或与之类似的名字). 2009年,Last.fm的Johan Oskarsson发起了一次关于分布式开源数据库的讨论,来自Rackspace的Eric Evans再次提出了NoSQL的概念,这时的NoSQL主要指非关系型.分

大数据时代的新型数据库 — 图数据库 Neo4j 的应用

概览 微云数聚(北京)科技有限公司是一家实力雄厚的大数据技术公司,由移动互联网技术专家团队.大数据专业团队和建模博士团队组成.微云数聚专注于研究图数据库技术及其应用,是世界领先的图数据库Neo4j在中国的战略合作伙伴和官方代理,他们研制的Neo4j简体中文扩展版,是专为中国企业量身打造.符合中国企业习惯的图数据库系统,除了提供简体中文界面,还支持节点显示成图片,显示效果由数据驱动:增加了智能查询,并且开发了简便导入Excel.MySQL和Oracle的工具--导入精灵,这些扩展将极大促进Neo4

大数据时代的可扩展性数据库集群技术

ZDNet至顶网服务器频道 06月05日 新闻消息:信息系统的背后用于保存和处理最终结果的地方就是数据库.因此数据库系统就变得尤为重要,这意味着如果数据库如果面临问题,则意味着整个应用系统也会面临挑战,从而带来严重的损失和后果.目前在大数据趋势下,数据库面临如下的挑战: 当数据库性能遇到问题时,是否能够横向扩展,通过添加服务器的方式达到更高的吞吐量,从而充分利用现有的硬件实现更好的投资回报率. 是否拥有实时同步的副本,当数据库面临灾难时,可以短时间内通过故障转移的方式保证数据库的可用性.此外,当

Cassandra与HBase的大数据对决 谁是胜者?

在大数据这一全新的领域里,Bigtable数据库技术非常值得我们关注,因为这一技术是由谷歌的工程发明的,而谷歌是一家公认的非常擅长管理海量数据的公司.如果你对此非常了解,那么你一家知道也熟悉Cassandra和HBase这两个Apache数据库项目. 谷歌在2006年的一份研究报告中首次对Bigtable进行了阐述.有意思的是,这份报告当时并没有将Bigtable作为数据库技术,而是将其作为一种"稀疏的分布式多维度"映射技术以存储拍字节级数据,并在商用硬件上运行它们.行先是以一种非常独

Teradata天睿公司推出下一代大数据应用

Teradata天睿公司宣布,推出基于Teradata Aster AppCenter领先技术的大数据应用,帮助企业将业务挑战转化为创收机会. 目前,企业从不同类型大数据中创造业务价值的挑战依然存在.因此,Teradata天睿公司开发出这一全新解决方案,帮助企业克服这些困难.Teradata面向企业的全新大数据应用能够帮助广泛的业务用户高效运用大数据分析技术,处理客户获取与维护.金融欺诈.购买路径.营销优化等各种问题,侧重于消费者金融.娱乐和游戏.医疗.零售和电信等众多行业需求.这些应用采用Ap