云计算一周热文回顾(3.12-17)

五大主流数据库模型

无论是关系型数据库还是非关系型数据库,都是某种数据模型的实现。本文将为大家简要介绍5种常见的数据模型,让我们来追本溯源,窥探现在流行的数据库解决方案背后的神秘世界。

1. 关系模型

关系模型使用记录(由元组组成)进行存储,记录存储在表中,表由架构界定。表中的每个列都有名称和类型,表中的所有记录都要符合表的定义。SQL是专门的查询语言,提供相应的语法查找符合条件的记录,如表联接(Join)。表联接可以基于表之间的关系在多表之间查询记录。

2. 键值存储

键值存储提供了基于键对值的访问方式。

键值对可以被创建或删除,与键相关联的值可以被更新。

键值存储一般不提供事务处理机制。

3. 文档存储

文档存储支持对结构化数据的访问,不同于关系模型的是,文档存储没有强制的架构。

事实上,文档存储以封包键值对的方式进行存储。在这种情况下,应用对要检索的封包采取一些约定,或者利用存储引擎的能力将不同的文档划分成不同的集合,以管理数据。

4. 列式存储

如果翻转数据,列式存储与关系存储将会非常相似。与关系模型存储记录不同,列式存储以流的方式在列中存储所有的数据。对于任何记录,索引都可以快速地获取列上的数据。

5. 图形数据库

图形数据库存储顶点和边的信息,有的支持添加注释。

五个值得关注的图形数据库

图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。最常见的一个例子,就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。

Google的图形计算系统名为Pregel,下面让我们来为您介绍几个流行的图形数据库。

1. Neo4j

Neo4j是一个流行的图形数据库,它是开源的。

2. FlockDB

FlockDB是Twitter为进行关系数据分析而构建的。FlockDB迄今为止还没有稳定的版本,对于它是否是一个真正的图形数据库,尚有争议。

3. AllegroGraph

AllegroGraph是一个基于W3c标准的为资源描述框架构建的图形数据库。它为处理链接数据和Web语义而设计,支持SPARQL、RDFS++和Prolog。

4. GraphDB

GraphDB是德国sones公司在.NET基础上构建的。GraphDB托管在Windows Azure平台上。

5. InfiniteGraph

InfiniteGraph基于Java实现,它的目标是构建“分布式的图形数据库”,已被美国国防部和美国中央情报局所采用。

下一代Hadoop战略——数据即平台

在上周的Strata大会上,与会者透露出有关下代Hadoop的消息。包括对6000节点的支持、配备高可用性的HDFS以及下一代MapReduce的特性等。而未来Hadoop替代操作系统的大胆想法也让我们充满无限遐想。

在Strata会议上Hortonworks创始人和Apache Hadoop项目VP Arun Murthy透露新版Hadoop的相关特性。下一代的Hadoop将支持6000节点,同时配备高可用性的HDFS(Hadoop Distributed File System)。

而下一代MapReduce框架则被命名为YARN或MRv2(MapReduce version 2)。新框架已经不再是传统的MapReduce框架,甚至与MapReduce无关,YARN可被看做是通用的运行时框架,用户可以编写自己的计算框架,在该运行环境中运行。经过改良的MapReduce将分离HDFS中块和命名空间的管理,提高数据的可伸缩性。最重要的是改良后的MapReduce将对非MapReduce应用进行支持,这使得更多类型应用将具备在MapReduce工作的能力。

谷歌算法揭秘:一次搜索请求平均往返2400公里

谷歌搜索演进

作为全球使用最广泛的搜索引擎,谷歌算法一直有一层神秘面纱。近日谷歌工程总监斯科特·霍夫曼向腾讯科技讲述谷歌算法幕后故事,称2011年有520多项改进,自2003年到现在,Google搜索已解决4500亿个搜索请求。

斯科特还透露,谷歌一个搜索请求平均往返于电脑和数据中心单程距离是750英里,这也意味着一次搜索请求平均往返需要1500英里,约合2400公里。

RavenDB:基于Windows/.NET平台的NoSQL数据库

众所周知,NoSQL运动旨在成为大数据时代传统关系数据库管理系统的替代品。如今Microsoft对开源的态度有所转变,RavenDB就是很好的例子。Microsoft对RavenDB(NoSQL数据库)的认可令很多人感到惊讶。RavenDB可以轻易的替代关系数据库管理系统并兼容以往的.NET应用。

RavenDB是针对Windows/.NET平台而设计的文档数据库。RavenDB的出现将.NET应用与非关系数据库连接到一起。数据以Shcema-less方式存储,并直接通过HTTP、RESTful API或更方便的.NET客户端API连接。.NET客户端API使用LINQ操作RavenDB数据库文档存储。

云计算:亚马逊第一 第二把交椅何人坐?

亚马逊对用户推出的Web服务,使它成为迄今为止最大的云服务提供商。就像大多数的大型云供应商一样,亚马逊并没有就当前或计划中的数据中心透露太多。

埃森哲分析师Huan Liu的最新研究结果显示,亚马逊的Elastic Compute Cloud(EC2)在高达45万台服务器上运行。亚马逊没有公布AWS的营收,但有人表示它可能已经是一项10亿美元的业务。

本文预计Rackspace、Google、微软、IBM、惠普、VMware、Facebook这七家公司将成为亚马逊的云对手。

新密钥技术简化云端数据加密

由于在云环境中,IT团队缺乏对数据安全的直接控制,所以数据迁移到云环境将会给IT团队带来新的复杂的安全问题。此外,云供应商认为数据安全是需要共同承担责任,即服务供应商保证物理安全,用户必须保护其服务器和数据的安全。这将需要新的加密策略和密钥管理策略,将密钥存储在云环境外部,而不是云环境中。

初创安全公司Porticor刚刚推出了一个解决方案,专门解决云环境中静态数据安全问题。Porticor公司提供了一种分离密钥加密解决方案,云客户是唯一知道主密钥的人。另外,Porticor公司解决了所有与加密数据有关的复杂问题,客户几乎不要去想这些问题。这种独特的密钥管理解决方案既提供了安全性,也提供了便利性。

微软下调Azure云服务价格 与亚马逊竞争

微软上周下调了其Azure云存储服务和Windows Azure Extra Small计算服务的价格。此举是微软在亚马逊下调其Web服务价格几天之后采取的行动。

这一切意味着什么?对于IT买主来说,云计算价格正在迅速下降并且已经与电费水平一样。考虑到电费受天然气价格、季节和其它可变因素的影响,云计算的价格可能更便宜。

时间: 2024-08-16 16:06:37

云计算一周热文回顾(3.12-17)的相关文章

云计算一周热文回顾:NoSQL数据库技术特性解析之文档数据库

NoSQL数据库技术特性解析之文档数据库 现今云计算的从业人员对NoSQL一词并不感到陌生,虽然很多技术人员都长期从事关系数据库的工作,但现在他们对NoSQL技术充满期待.对于企业来说,从关系型数据库到NoSQL数据库转变绝对是个需要深思熟虑的大改变.这涉及的不仅是软件的变化,更多的是对于数据存储上观念性的变化. 大多数非关系数据库都具有快速和可伸缩的特性.通过放弃关系存储模型和架构,关系数据库便可脱离由紧密结合的架构所带来对其施加的限制.应用程序也无需再链接数据库内表中的数据. MongoDB

云计算一周热文回顾:一网打尽18种主流数据库

一网打尽18种主流数据库:12种SQL+6种NoSQL 还记得两三年前仅有几家云计算平台供应商可供选择的时候,似乎市场上也没有多少云数据库.但是云蓬勃发展之后,云数据库也呈现雨后春笋之势.而哪些是真正可靠而易用的,对用户而言,并不好分析.所以,本文分析了18种数据库的可用性以及应用方向(注意,这里说的管理数据库服务,不是仍然需要用户管理和实施的数据库实例).仍有不足之处,希望听到大家更多的评论. 谷歌120美元光纤,让我100余元8M宽带情何以堪! 现在,互联网已成为我们生活中不可或缺的一部分,

云计算一周热文回顾(3.19—3.24)

Google骂微软夸 Facebook开源数据中心王国 与严格保密的Google不同,Facebook不仅全新设计的服务器和数据中心,并且将其设计方案开源,这简直是对Google莫大的蔑视.每一个Google员工都需要签署一份保密协议,而这在Facebook根本不需要.就连一向保守的微软也沉不住气,公布了都柏林数据中心的部分细节.不过,据Google前员工透露,Google的数据中心十分强大.但开放的Facebook却获得了更多拥护者,包括英特尔.Dell.华硕.Rackspace都加入了Ope

云计算一周热文回顾:任正非首谈接班人制度

任正非首谈接班人制度:相信华为惯性 华为总裁任正非近期撰写一篇内部文章为轮值CEO鸣锣开道,在这篇文章中,他回顾了自己从个人英雄主义到相信团结就是力量的心路历程,回顾了公司的组织机构从无到有到现在实行轮值CEO的制度的演变,谈及接班人们,他说,"相信华为的惯性,相信接班人们的智慧." 去年,曾有传闻称,任正非为了让儿子任平顺利接班,以10亿元人民币的"分手费"逼走公司董事长孙亚芳,随后华为公司发声明予以否认. 在这篇文章中任正非特别提到在2002年公司内外交困时,&

云计算一周热文回顾:大数据成功预测美国大选

大数据成功预测美国大选 显然,"大数据"并不真正关心谁来当选下一届美国总统.不过所有的数据都显示:政治科学家和其他人相关人士都认为奥巴马获得连任可能性比较大.本次的成功预言,展示了大数据强大的能量. 统计模型在过去的几个星期里一直关注纽约时报FiveThirtyEight的博客作者和统计学家Nate Silver引导的热门话题(甚至可以说是争论).Silver已经成为本次争议的焦点人物,在"旋风般"地宣传他的新书的同时,他的模型预测:奥巴马有超过80%的机会赢得周二

云计算一周热文回顾(4.9-4.14)

大数据从业者市场现状:薪酬持续增长 人才缺口巨大 在大数据时代,企业之间正在为了吸引并留住商业智能和信息管理的专业人才而展开战争.在InformationWeek每年公布的IT从业人员薪金调查中可以看出大数据从业人员面临巨大的缺口. 现今大数据呈现出"4V + 1C"的特点.既Variety:一般包括结构化.半结构化和非结构化等多类数据,而且它们处理和分析方式有区别:Volume:通过各种设备产生了大量的数据,PB级别是常态:Velocity:要求快速处理,存在时效性:Vitality

云计算一周热文回顾(2.6—2.10)

文件传输协议(FTP)必将消亡 文件传输协议(FTP)在RFC 959中定义,于1985年10月发布.文件传输协议(FTP)被设计成为一个跨平台的.简单且易于实现的协议. 文件传输协议(FTP)有一个漫长的演化史,是互联网上最重要的应用之一,但时至今日,却已江河日下.本文作者从各方面列举了一些文件传输协议(FTP)为人诟病的缺点. 1.数据传输模式不合理 不考虑文件自身的内容,一味使用ASCII模式传输数据是不合理的. 2.工作方式设计不合理 文件传输协议(FTP)可以在主动模式(PORT)或被

云计算一周热文回顾

观点:互联网海量数据蕴藏巨大"金矿" 根据IDC的调查报告显示,2010年底全球数据量已达到1.2ZB.到2020年全球电子设备存储的数据将暴增30倍,达到35ZB(相当于10亿块1TB的硬盘的容量).但对于有准备的企业来说这无疑是一座信息金矿,随着数据挖掘技术的进步,有价值的信息将变得容易获取. 随着大数据时代的到来,数据存储.数据挖掘以及处理和分析大数据的相关技术比以往任何时候都更受关注.大数据正成为企业发展的基石,并渐渐改变很多行业的商业模式.使用诸如Hadoop等非传统的数据筛

云计算一周热文回顾(2.27—3.3)

巅峰对决:Hypertable(C++)吞吐率测试完胜HBase(Java) 众所周知,2006年Google公布了自己的BigTable论文,作为Google继GFS和MapReduce两项创新之后的又一项创新,其在设计用来针对海量数据处理情形下的管理结构型数据方面具有着巨大的技术优势.而Hypertable和HBase是最知名的两款基于BigTable为蓝本设计的数据库,他们的不同之处在于Hypertable基于C++实现,而HBase则基于Java.两种数据库的性能也一直是人们争论的热点话