MongoDB迎来原生数据分析功能

  为了让大家更轻松地将分析机制引入自己的大数据存储体系当中,Pentaho公司今天公布了其业务分析与数据集成平台的最新版本已经正式进入通用阶段。

  Pentaho 5.1版本的设计目的在于为“数据与分析两个独立领域”架起一道往来的桥梁,从而为全部Pentaho用户——从开发人员到数据科学家再到商务分析师——提供支持。Pentaho 5.1为直接为MongoDB数据存储体系带来了运行无需使用代码的分析机制,并利用新的数据科学工具包作为相关专业人士的“个人助手”。除此之外,新版本还能够全面支持用于进行资源管理的Apache Hadoop 2.0 YARN架构。

  “Pentaho 5.1当中的新能力可以支持我们下一步的战略规划,包括难度最高的大数据分析速度提升、简化以及访问性改进等等,”Pentaho公司执行副总裁兼首席产品官Christopher Dziekan指出。“随着5.1版本的发布,Pentaho得以进一步实现大规模响应分析功能,这不仅能够满足以数据驱动为目标的大型企业的实际需求、同时也能为中小型企业以及新兴厂商带来能够与传统巨头进行竞争的公平环境——即使没有专业开发团队,大家也完全可以在大数据舞台上一试身手。”

  数据集成平台让MongoDB数据原生分析成为可能

  Pentaho平台的前续版本已经允许使用者将其与MongoDB相集成,将后者作为数据源并针对MongoDB数据提供报告。现在Pentaho新版本则更进一步,直接为MongoDB中的数据带来原生分析机制,而且无需涉及电子传输层处理或者进行编码操作。MongoDB数据集能够在源头处直接交付分析,从而降低了获取结论的时间消耗以及对用户专业技能的要求。

  Dziekan指出,医疗成本解决方案供应商MultiPlan公司目前已经拥有约90万家医疗供应商作为其合作伙伴,每年需要处理的事务超过4000万项。Dziekan指出,MultiPlan公司从自己的门户网站中获取JSON源文件并将其保存在MongoDB当中。他们使用的正是Pentaho Analyzer插件,这是一套拖拽操作式OLAP查看工具,以MongoDB为基础、旨在将数据进行拆分细化并创建起相关仪表板与报告。

  “传统RDBMS(即关系型数据库管理系统)分析机制往往非常复杂,而且在处理半或者非结构化数据时显得诡异而笨拙,”MultiPlan公司首席软件架构工程师Chris Palm表示。“Pentaho 5.1平台能够满足这类市场需求,允许用户直接在MongoDB内部实现数据分析工作。我们已经见识到了新版本带来的更为准确的分析结果,而且这一切不再受到无法处理全部数据的严重局限。我们现在可以将更为完整的数据集纳入分析范畴,从而让我们的记录系统获得更加全面的分析结论。”

  数据科学家迎来个人助手

  Pentaho公司还在Pentaho 5.1当中纳入了新的数据科学工具包,从而让使用者更轻松地完成数据分析任务,并帮助数据科学家快速建立起360度全方位客户视角与数据源混合机制,其中包括社交网络与MongoDB。这套工具包为Pentaho数据集成(简称PDI)功能新增了R脚本执行器,允许用户将R脚本作为PDI转换流程的组成部分,从而大大简化了数据准备所面临的负担。工具包还引入了Weka评分工具,允许用户在其中使用分类、聚类以及回归模型。除此之外,它还加入了Weka预测,帮助用户利用预测模型在Weka中创建出时间序列分析以及预测环境。

  “数据科学家相当于获得了自己的个人助手,”Dziekan表示。“这套数据科学工具包当中提供大量可直接使用而且为数据科学家们所熟悉的工具,我们现在已经能够操作它们为自己服务。”

  Pentaho 5.1平台还加入了完整的YARN集成能力,从而让开发人员更轻松地利用Pentaho数据集成功能充分发挥Hadoop的强大计算能力,同时无需编写复杂的MapReduce代码。Dziekan表示,YARN支持能力的加入让PDI作业能够以弹性方式使用Hadoop资源,根据数据规模与处理要求的变化自由进行扩展与收缩。他同时指出,对YARN高级资源管理功能的支持能够将多种工作负载场景加以融合,从而带来用户渴望已久的持续性数据转换与分析机制。

  原文链接:http://www.cio.com/article/2375115/business-intelligence/native-data-analysis-comes-to-mongodb.html

时间: 2024-09-19 09:32:34

MongoDB迎来原生数据分析功能的相关文章

Win10版PowerPoint Mobile即将迎来协作编辑功能

  Win10版PowerPoint Mobile即将迎来协作编辑功能           现在微软计划扩大该功能支持范围,Win10版PowerPoint Mobile很快将会迎来协作编辑功能. 除此之外,微软也在尝试为桌面版PowerPoint 2016.安卓版Word和PowerPoint添加实时合著,安卓版将在下个预览版中可用.在今天更新的iOS版Word和PowerPoint中已经支持实时合著. 微软的目标是为所有平台的Office套件增加实时合著,赋予不同平台设备用户协作编辑的能力.

MongoDB 全文检索和标签功能

简单翻译. 原文:http://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo MongoDB是通过增加一个tags的数组来实现标签功能(tagging). obj = {  name:     "Apollo"     ,        text:  "Some text about Apollo moon landings",   tags: [ "moon"  ,  "

android-Android原生分享功能分享链接

问题描述 Android原生分享功能分享链接 怎么用Android原生的分享功能分享链接啊.希望实现分享到微信.QQ.还有微博.点击分享内容可以跳转到所分享的网址 解决方案 Intent share_intent = new Intent(); share_intent.setAction(Intent.ACTION_SEND); share_intent.setType("text/plain"); share_intent.putExtra(Intent.EXTRA_SUBJECT

Win 7下活用闪存盘“原生”加密功能

  相信很多朋友都会选择小巧玲珑的闪存盘作为可移动的存储设备,不过如果万一遗失的话,恐怕可能会导致数据的丢失,但使用第三方的加密软件却又相当麻烦,毕竟安装.注册也不是件容易事.其实,如果你已经开始Windows 7,那么可以借助BitLocker为闪存盘添加"原生"的加密功能,而且操作也是相当的简单. 按步就班 快速加密闪存盘 其实,早在Windows Vista时代,操作系统就已经提供名为BitLocker的安全功能,不过仅仅在企业版和旗舰版本中得到应用.Windows 7的BitL

EMC Greenplum增非结构化大数据分析功能

EMC今天宣布Hadoop Data Computing Appliance(DCA)设备中增加了一项新功能,允许用户将非结构化与结构化数据分析平台结合起来. EMC还公布了Greenplum Analytics Workbench--一个针对Apache Hadoop软件集成测试的1000节点测试台. 该测试台为Hadoop开源社区提供了测试资源以快速识别错误.稳定新版本以及优化硬件配置,努力加快Hadoop的创新.所有测试和结果都将返回至Apache Software Foundation和

OpenBSD 将迎来原生的 Hypervisor

据 OpenBSD 开发者 Mike Larkin 透露, 他在过去的几个月里一直在致力于实现一个名为"vmm"的 OpenBSD 上的原生的 hypervisor.Larkin 说,他采用了一种全新的方法来实现 这个 hypervisor,而不会把它做成现有的 hypervisor 的一份子(如 bhyve,.KVM 等).基于这样的指导思想,他在 hypervisor 中加进了那些他觉得重要的功能特性,包括"支持i386.影子分页技术.嵌套虚拟环境技术以及支持遗留外围设备

VMware的Virtual SAN迎来闲置数据加密功能

VMware公司已经发布其虚拟存储区域网络(简称VSAN)的新一轮beta测试版本. 虚拟巨头存储与可用性首席技术员Duncan Epping在博文中指出,VMware公司"正高度关注以下三项功能的相关反馈意见": 软件闲置数据加密功能 面向双层延伸集群保护的跨站点与本地嵌套故障域(Nested Fault Domains,简称FD)功能 新的运营管理增强(vRA集成.vCenter提供的运行状态检查以及监控网络状态等等)功能 第一点很好判断:加密机制基本上不会是什么坏事,尽管其会给阵

MongoDB 2.0新功能逐个看之Compact Command

今天到了公司打开邮箱,惊喜地发现有http://www.aliyun.com/zixun/aggregation/13461.html">MongoDB的新闻信,打开一看竟然是2.0更新了,哈哈,于是迫不急待地开始尝试,因为我平时主要只维护数据库,并不涉及开发部分,所有理解有限,大部分还是以翻译为主.以下为官方文档地址:http://www.mongodb.org/display/DOCS/2.0+920.html">Release+Notes?mkt_tok=3RkMMJ

excel的数据分析功能添加和使用方法

  1.以office07版为例;新建并打开excel表格,如图 2.首先添加数据分析插件,点击左上角按钮,出现菜单页面,选中右下角"EXCEL选项"按钮,点击,如图 3.然后点击"加载项"选项,选中"分析工具库",点击下方"转到"按钮,如图 4.然后出现excel加载宏界面,在"分析工具库"前方框内打勾,点击确定. 5.经过上一步已经成功添加"数据分析插件",在"数据&quo