VMware扩展大数据 试图虚拟化Hadoop

  VMware宣布,将允许用vSphere来管理Hadoop集群。这样一来,成千上万的VMware企业客户将能够使用他们已经熟悉的软件来控制Hadoop部署。从技术方面说,这提高了该公司在虚拟化基础设施运行Hadoop节点的水平,同时将虚拟化的优势带到了大数据平台。

  VMware日前推出了VMware vSphere Big Data Extensions(大数据扩展),这将允许该公司广受欢迎的基础设施管理软件来控制企业客户建立的Hadoop集群。该扩展仍然需要一个基础Hadoop平台,HortonWorks、MapR、Cloudera或者VMware的合作伙伴Pivotal都基于这个开源Apache代码来分配。这个大数据扩展允许这些分配任务通过vSphere来管理。Taneja Group高级分析师Michael Matchett表示:“VMware让企业能够托管他们自己的大数据即服务。”

  VMware通过其Serengeti项目这些功能,该项目的目标是优化Hadoop集群以在虚拟化基础设施上运行。Matchett表示,这是该项目迈出的非常重要的一步。在虚拟机上运行Hadoop节点,而不是在裸机上运行,带来了与虚拟化计算服务器相同的优势:更有效地使用硬件资源以及更灵活地管理系统。Matchett表示:“你可以在虚拟环境中托管Hadoop,因为这将让你能够混合其他工作负载,并且跨多个客户端利用基础设施的优势。”

  其他公司也在试图虚拟化Hadoop集群。
亚马逊云计算服务提供的Elastic Map Reduce(EMR)产品,基本上是类似Hadoop的公共云服务。而VMware主要是针对私有云和客户端部署。

  为vSphere增加支持也可能预示着VMware的其他举措。
例如,VMware可能扩展该平台以允许使用该公司即将推出的公共云产品(
预计今年晚些时候推出)来
轻松地迁移vSphere管理的Hadoop工作负载。其他公司(特别是微软)也将允许通过自己的管理软件来控制Hadoop发行版。

  VMware推出的这些新功能是公开测试版的一部分,客户本周可以使用vSphere 5.1来报名
参加公测,预计这些功能将在年底
正式推出。除了宣布这个扩展外,VMware表示Serengeti项目支持Apache Hadoop的最新开源代码,包括
新的YARN功能,Hadoop社区的一些人
认为这个
资源管理器可能带来更多基于Hadoop平台的新的应用程序。

时间: 2024-10-28 12:48:46

VMware扩展大数据 试图虚拟化Hadoop的相关文章

VMware扩展大数据项目 试图虚拟化Hadoop

VMware近日宣布,将允许用vSphere来管理Hadoop集群.这样一来,成千上万的VMware企业客户将能够使用他们已经熟悉的软件来控制Hadoop部署.从技术方面说,这提高了该公司在虚拟化基础设施运行Hadoop节点的水平,同时将虚拟化的优势带到了大数据平台. VMware日前推出了VMware vSphere Big Data Extensions(大数据扩展),这将允许该公司广受欢迎的基础设施管理软件来控制企业客户建立的Hadoop集群.该扩展仍然需要一个基础Hadoop平台,Hor

VMware发布大数据扩展 试图虚拟化Hadoop

VMware近日宣布,将允许用vSphere来管理Hadoop集群.这样一来,成千上万的VMware企业客户将能够使用他们已经熟悉的软件来控制Hadoop部署.从技术方面说,这提高了该公司在虚拟化基础设施运行Hadoop节点的水平,同时将虚拟化的优势带到了大数据平台. VMware日前推出了VMware vSphere Big Data Extensions(大数据扩展),这将允许该公司广受欢迎的基础设施管理软件来控制企业客户建立的Hadoop集群.该扩展仍然需要一个基础Hadoop平台,Hor

求推荐学习“大数据”、“虚拟化”、“云计算”三类书籍

问题描述 小子是一位在校生,今年下学期大三.想在自己空闲的时间学习一下"大数据"."虚拟化"和"云计算"三种技术中的一种.求推荐好的学习书籍,谢谢.小子之所以向各位前辈和小伙伴求推荐关于学习这三个专业的书籍,是因为我可以将好的书籍向学校图书馆推荐,学校图书馆会将这些书买回来供学校学生使用.嗯,前不久去学校图书馆查了查关于这三个方面的专业书籍,感觉都没有什么好的书籍.就"大数据"这个方面更是一本书都没有.所以来这里想各位询问一下

VMware的大数据战略:精明还是错误?

尽管很多IT部门希望托管应用,在云端处理极大量的数据,最流行的"大数据"平台需要专注于硬件,因为其可能导致可靠性问题. 这个问题可能会随着VMware的Apache软件基金会(ASF)的开源项目Serengeti而改变.这个项目将允许企业在云端和虚拟环境中,在vSphere 5.0上部署和管理Apache Hadoop. 虚拟基础架构云上的Hadoop消除了可靠性问题;通过vSphere,Hadoop应用如果节点失败能够自动重启. 此外,虚拟化巨鳄也正致力于同Hadoop社区成员合作,

2014年大数据应用:Hadoop正处于上升期

文章讲的是2014年大数据应用:Hadoop正处于上升期,根据最新的Forrest报告,有很多公司都在努力挖掘他们拥有的大量数据,包括结构化.非结构化.半结构化以及二进制数据等,探索对数据的深入利用.下面是报告结论的其中一点: 大多数公司估计他们只分析了已有数据的12%,剩余88%还没有被充分利用.大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因.另外一个难题是如何判断数据是否有价值.尤其是在大数据时代,你必须采集并存储这些数据.一些看起来与业务无关的数据,如手机GPS数据,将来也可能是座

在大数据里:Hadoop可能是你的救命稻草

文章讲的是在大数据里:Hadoop可能是你的救命稻草,用于数据分析的开源Hadoop架构的巨大增长是由其结构化和非结构化数据量的增长所驱动的,并且很多权威组织也预测,未来Hadoop架构还将继续增长,并需要复杂的可访问工具来从数据中提取业务和市场信息. 对于Hadoop来说,前景很乐观--开源框架旨在促进巨大数据集的分布式处理.Hadoop对企业越来越具有吸引力,因为它既可以获取大数据的好处,同时又避免了基础架构费用. 联合市场研究部门最近的一份报告表明,Hadoop市场将实现从2013年到20

《Spark与Hadoop大数据分析》一一1.2 大数据科学以及Hadoop和Spark在其中承担的角色

1.2 大数据科学以及Hadoop和Spark在其中承担的角色 数据科学的工作体现在以下这两个方面:从数据中提取其深层次的规律性创建数据产品要从数据中提取其深层次的规律性,意味着要使用统计算法提炼出有价值的信息.数据产品则是一种软件系统,其核心功能取决于对数据的统计分析和机器学习的应用.Google AdWords或Facebook里的"你可能认识的人"就是数据产品的两个例子.1.2.1 从数据分析到数据科学的根本性转变 从数据分析到数据科学的根本转变的根源,是对更准确的预测和创建更好

《Spark与Hadoop大数据分析》——1.2 大数据科学以及Hadoop和Spark在其中承担的角色

1.2 大数据科学以及Hadoop和Spark在其中承担的角色 数据科学的工作体现在以下这两个方面: 要从数据中提取其深层次的规律性,意味着要使用统计算法提炼出有价值的信息.数据产品则是一种软件系统,其核心功能取决于对数据的统计分析和机器学习的应用.Google AdWords或Facebook里的"你可能认识的人"就是数据产品的两个例子. 1.2.1 从数据分析到数据科学的根本性转变 从数据分析到数据科学的根本转变的根源,是对更准确的预测和创建更好的数据产品需求的不断增长. 让我们来

大数据利器:Hadoop的十大应用场景

本文讲的是大数据利器:Hadoop的十大应用场景,谁在用Hadoop?这是个问题.在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深.但谁才是Hadoop的最大用户呢?首先想到的当然是它的"发源地",像Google这样的大型互联网搜索引擎,以及Yahoo专门的广告分析系统.也许你会认为,Hadoop平台发挥作用的领域是互联网行业,用来改善分析性能并提高扩展性.其实Hadoop的应用场景远不止这一点,深入挖掘的话你会发现Hado