Hadoop Summit 2013:最受关注的13款大数据产品

大数据是当下IT领域最活跃的话题之一。没有比近日在圣何塞举行的Hadoop Summit 2013更好的地方去了解关于大数据的最新动态了。

有超过60家大数据公司参与其中,既包括像英特尔和Salesforce.com这样的知名厂商,也有像Sqrrl和Platfora这样成立没有多久的初创公司。以下是这次峰会上展示的13款全新的或者增强的大数据产品。

Continuuity开发公司现在支持批量处理

Continuuity发布了支持批量处理的Continuuity Developer Suite 1.7,将MapReduce集成到平台中为开发者提供更广泛的工作负载能力。

Continuuity帮助Java开发者构建能运行Hadoop和HBase数据库的应用。这些应用支持像运作分析这样的实时应用。但是Continuuity的首席执行官Jon Gray表示,一些应用仍然要求MapReduce的批量处理架构。

Continuuity Developer Suite 1.7还提供了一些用于流式实时分析、定位和个性化以及异常检测的应用模板。

Datameer首次展示大数据分析软件

Datameer发布了面向企业用户的Datameer 3.0数据集成和分析软件。该版本增加了“智能分析”功能,可以从Hadoop中保存的大量复杂数据中自动找出模型和关联性。

Datameer 3.0采用四种机器学习的技术:聚类、决策树、列依赖性和建议。虽然这些通常是数据科学家涉足的领域,但是被集成到了Datameer软件中,这样企业用户就可以将其作为一项自助服务使用。

Datameer 3.0将在未来几个月内提供给用户进行beta测试。

Hortonwork社区预览支持Yarn的HDP 2.0平台

Hortonworks将在社区中预览下一代支持Yarn(下一代Hadoop数据处理框架)的Hortonworks Data Platform。

作为ASF Hadoop项目的一部分,Yarm旨在实现多个用户实例,而不是单一的数据集。HDP 2.0社区预览版本中支持Yarn,将让Hortonworks的合作伙伴和客户能够使用这项新技术,参与到最终规范的制定中,Hortonworks营销副总裁Dave McJannet这样表示。

Kognitio推出第八代分析平台

Kognitio推出了新一代的Kognitio Analytic Platform,加强了多种编程语言之间的连接性,并提高了性能。新版本提供了NoSQL处理能力,以及大规模并行处理任何脚本或者像R、Python或者Java这样的二进制代码。

使用该版本进行基准测试表明,它将答案返回给复杂查询请求的速度是上一版本的两倍。

新版本还提供了高速数据输出,针对高速数据备份以及内存压缩,作为一个可选功能。

MapR和Fusion-io联手提高HBase性能

MapR和Fusion-io合作,在运行读取密集型HBase应用的时候,将基于Hadoop的MapR M7大数据平台与Fusion-io ioMemory系统结合起来,实现重要的性能提升。

据MapR称,HBase应用性能通常受到磁盘存储瓶颈的限制。使用Fusion-io ioMemory,MapR系统的性能提高25倍。

I/O性能的局限性,会使采用HBase开源数据库用于高性能计算任务的速度变慢。

Pentaho添加大数据平台集成能力

业务分析应用开发公司Pentaho,推出了所谓其软件中的“自适应大数据层”,提供与大数据平台集成的能力。

这项新技术将Pentaho与Hadoop发行版连接起来,如Cloudera、Hortonwork、MapR Technologies、Intel、NoSQL数据库Cassandra以及MongoDB。

RainStor升级数据库安全性及搜索能力

RainStor推出了对其数据库软件的重要更新,增强了安全特性,并称这样可以提高Hadoop在安全敏感的客户中的采用,例如政府机构、银行和电信公司。

RainStor数据库中的新安全功能,它本身运行在Hadoo中,包括数据加密、数据掩蔽以及查看、审查跟踪、防篡改、可配置的数据弃置,支持Kerberos、LDAP、Active Directory以及PAM(Linux的可插拔认证模块)。

据RainStor称,新搜索功能提高数据库的查询性能达到10倍~100倍,能实现更高速的文本搜索。现在数据库可以搜索数十亿条记录,数PB的数据。

Splunk发布针对Hadoop的数据分析工具

以其实时运作智能软件而为大家熟知的Splunk,推出了Hunk的新测试版本:Splunk Analytics for Hadoop。

Hunk集成了对Hadoop数据进行挖掘、分析和虚拟化的工具。它采用Splunk针对数据分析的虚拟索引技术,提供了用于提供表格、图形、自定义仪表板和报告的工具。

该软件支持来自Cloudera、Hortonworks以及MapR的主流Hadoop发行版。

Sqrrl发布安全大数据平台

初创公司Sqrrl即将推出Sqrrl Enterprise 1.1,一个用于开发实时分析应用的安全、可扩展平台。随着该版本的发布,Sqrrl将从有限的发布阶段接入全面供货阶段。

1.1版本还提供了更多基于Apache Accumulo的高级安全工具、增强的分析功能、以及像JSON这样的特性。新的分析功能包括全文搜索,使用Apache Lucene、SQL、统计以及图形搜索。

Accumulo技术最初是由美国国家安全局开发的,在2011年被分拆出来作为一个开源项目。

Teradata发布针对Hadoop的产品组合

Teradata推出了Teradata Portfolio for Hadoop,一个集硬件平台、软件、咨询服务、培训以及客户支持的产品组合,用于开发和管理Apache Hadoop。

这其中包括Teradata Appliance for Hadoop以及Teradata Aster Big Analytics Appliance这样的“优质平台”可供选择。前者加载了Hortonworks的Hadoop发行版、Mellanox Infiniband硬件以及Teradata的BYNET V5软件。后者包括Aster数据库、SQL-MapReduce和Apache Hadoop。

Teradata还提供了针对那些希望在戴尔标准服务器上部署Hadoop的Teradata Commodity Configuration for Hadoop产品。Teradata Software Only for Hadoop是一个软件捆绑产品,针对那些希望使用和配置自己的硬件的企业。

VMware支持Hadpp和大数据工作负载

VMware推出了公共测试版本的VMware vSphere Big Data Extensions,一项将VMware虚拟化平台扩展支持Apache Hadoop和大数据处理的新特性。

企业客户可以使用新软件开发、运行和管理Apache Hadoop集群,以及其他通用虚拟基础设施上的应用。这为Hadoop系统带来了虚拟化的好处,包括可扩展性、性能以及弹性,VMware产品管理高级总监Fausto Ibarra这样表示。

VMware vSphere Big Data Extensions源自于VMware的Serengeti开源项目,预计在今年年底全面提供给客户。

WANdisco发布Hadoop新发行版以及HA软件

时间: 2024-08-01 12:34:29

Hadoop Summit 2013:最受关注的13款大数据产品的相关文章

奥维云网推多款大数据产品 奥维万象今揭牌

3月9日,2016年中国家电及消费电子博览会(简称"AWE2016")开幕.作为全球三大家电及消费电子展之一,本届AWE主题为"互联网+我的家","互联网+"在家电业中的优化和集成作用将作为重点展示,600多个家电及零配件厂商均将参展.在此背景下,2016中国大数据创新应用大会今日在上海召开. 中国家用电器协会秘书长徐东生表示,2016中国大数据创新应用大会作为中国家电及消费电子博览会(AWE)的重磅会议之一,中国家用电器协会的高度重视本次会议的

2013 Hadoop Summit 大数据产品汇总

大数据是当下IT领域最活跃的话题之一.没有比近日在圣何塞举行的Hadoop Summit 2013更好的地方去了解关于大数据的最新动态了. 有超过60家大数据公司参与其中,既包括像英特尔和Salesforce.com这样的知名厂商,也有像Sqrrl和Platfora这样成立没有多久的初创公司.以下是这次峰会上展示的13款全新的或者增强的大数据产品. 1. Continuuity开发公司现在支持批量处理 Continuuity发布了支持批量处理的Continuuity Developer Suit

2013 Bossie评选:最佳开源大数据工具

MapReduce的出现是为了突破数据库的局限.Giraph.Hama以及Impala等工具的出现则是为了突破MapReduce的局限.虽然上述方案的运行都需要以Hadoop为基础,但图形.文档.列式以及其它NoSQL数据库也是大数据当中不可或缺的组成部分. 哪款大数据工具能够满足您的需求?这个问题在如今解决方案数量迅速增长的背景之下,确实不容易回答. Apache Hadoop 当人们说起"大数据"或者"数据科学"时,他们指的往往是Hadoop项目.总体而言,Ha

选择一款大数据可视化展示工具,要几步?

众所周知,选择一款好用的大数据可视化展示工具是很多企业的共同问题.现在市面上,有很多的大数据可视化工具,国内外的,价位也不同.但是如果能万里挑一,选中一款适合自家企业的大数据可视化BI产品,可以说如虎添翼,实现企业大数据完美落地之路.因为,优秀的大数据可视化展示工具,不仅仅是使用敏捷,而且还可以帮助企业家更好地做决策,这一点是很多大数据可视化工具很难实现的一个高度. 那接下来就回到本文的主题:选择一款大数据可视化展示工具,要几步?其实,挑选BI工具没有固定的步骤,只是说在挑选过程中,客户应该看重

【Hadoop Summit Tokyo 2016】如何构建成功的数据湖泊

本讲义出自 Alex Gorelik在Hadoop Summit Tokyo 2016上的演讲,主要介绍了数据湖泊的相关概念,介绍了数据湖泊可以赋能数据驱动的决策制定以及最大化商业价值,以及如何通过正确的数据+正确的平台+正确的接口构建成功的数据湖泊.

【Hadoop Summit Tokyo 2016】基于Apache Spark的数据科学

本讲义出自Robert Hryniewicz在Hadoop Summit Tokyo 2016上的演讲,主要介绍了数据科学以及机器学习的相关基本概念以及机器学习的例子,并分享了机器学习的方法,还分享了K-means的聚类方法.决策树以及随机森林等相关知识.

【Hadoop Summit Tokyo 2016】使用Amaterasu项目进行数据操作

本讲义出自Yaniv Rodenski与Karel Alfonso在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据管道的相关知识以及其主要作用,并且分享了数据管道建造者的原型.数据操作以及协作等相关内容,还分享了大数据应用的持续集成的案例,最后还介绍了Apache下的开源分布式资源管理框架Mesos的相关内容.

【Hadoop Summit Tokyo 2016】现代化企业级数据仓库:数据湖泊

本讲义出自CHARLES SEVIOR在Hadoop Summit Tokyo 2016上的演讲,主要分享了面对企业级数据仓库向着数据量剧增.实时处理数据的需求增加以及数据分析的需求不断涌现的情况,如何定制个性化以及增强的现代化企业级数据仓库服务成为了一项巨大的挑战,而面对这样的挑战使用数据湖泊技术成为了一种新的解决方案.

美国2013年高薪技术排行:大数据居首

最新调查显示,大数据相关技术囊括了技术领域高薪的Top 3,分别为Hadoop.Big Data及NoSQL.而苹果相关的岗位次之,比如Omnigraffle及Objective-C,而Java.C等主流技术领域的排行并不理想. 以下为译文: 也许一些企业至今还未真正了解大数据的价值,但是却并不影响他们在类似Hadoop及NoSQL等大数据技能上的大笔投资.通过一个2013 Dice Tech Salary Survey了解到,大数据项目的两个支柱(Hadoop及NoSQL)人才的价值高于其它任