继续支持开源,IBM新型主机平台能够更好支持Spark

IBM公司近日宣布推出基于Apache Spark的新型z/OS平台,以帮助企业使用IBM大型主机更加方便、快捷地访问和分析数据。此举将给数据科学家和开发人员创造新的机会,帮助他们对系统丰富的数据集进行高级分析,以实现实时洞察。Apache Spark是一种开源的分析框架,IBM此次推出的基于Spark的z/OS平台将支持其在z/OS主机操作系统上实现本地运行。新的操作系统平台可以帮助数据科学家打通分析库和底层文件系统之间的联系,无需进行提取、转换和加载(ETL)即可对数据实现就地分析。

在认知时代,数据作为一种新的自然资源能够被计算机系统所理解、推理和学习,但企业必须在数据价值有效期内对其进行分析,形成洞察并予以应用。新的z/OS平台配有来自业务合作伙伴的加速器,可以帮助企业更便利地利用大型主机的数据和能力,来了解市场变化和客户的个性化需求,从而对业务及时进行调整,更快实现价值。

IBM大型主机被全球各大银行、保险公司、零售商和运输公司广泛用于关键数据处理和交易。它拥有业界最快的商用微处理器,以及内置的交易分析功能,可以在不超过2毫秒的时间内为某项交易的预测模型评分。目前,企业可以利用这些功能,在无需从主机中下载数据(without moving data off the mainframe)的条件下通过Spark来进行高级内存中分析,既节省时间和成本,又降低风险。

IBM专注于新兴互联网技术的院士Rod Smith表示,“各种规模的企业在向实时数字化转型时,都需要对自己所有的数据了解清楚,这个过程不应花费过多的时间,也不应有提取、转换和加载(ETL)的风险。现在我们实现了在包括大型主机在内的IBM平台上本地(natively)运行Apache Spark,客户可以并行执行处理关键数据的交易处理系统和分析系统,同时从其他数据源获取关联洞察,帮助他们与客户进行实时互动,继而产生效益。”

基于Apache Spark推出的IBM z/OS平台具备Apache Spark core、Spark SQL、Spark Streaming、Machine Learning Library (MLlib)和Graphx等开源功能,可提供业内唯一的主机常驻Spark数据提取解决方案。新的平台帮助企业通过以下途径更加高效、安全地获取信息:

简化开发——开发人员和数据科学家可利用他们已有的Scala、Python、R和SQL等编程经验来更快实现可用洞察的价值。

简化数据访问——经过优化的数据抽象化服务消除了复杂性,通过Apache Spark API使用熟悉的工具对IMS、VSAM、DB2 z/OS、PDSE或SMF等传统格式实现企业数据的无缝访问。

就地数据分析(In-place data analytics)——Apache Spark使用内存计算来处理数据,可以快速产生结果。新平台具备数据抽象和集成服务功能,可以让z/OS分析应用程序利用标准Spark API。这可以让企业就地分析数据,避免产生提取、转换和加载相关的高额处理和安全性问题。

开源功能——新平台提供了一个应用于Apache Spark、专门针对大数据设计的开源内存计算引擎。

IBM也在与DataFactZ、Rocket Software和Zementis这三家公司进行合作,通过IBM z/OS平台为Apache Spark开发定制解决方案:

DataFactZ是IBM新的合作伙伴,双方正在合作开发基于Spark SQL和MLlib的Spark分析产品,以用于在大型机上处理的数据和交易。

Rocket Software已经成为IBM的长期合作伙伴,两家公司在z/OS Apache Spark领域也已展开合作。比如,新的Rocket Launchpad解决方案可以让客户使用z/OS数据来体验平台功能。

Zementis正在开发支持Apache Spark的基于多个标准的执行引擎。作为一款新的z/OS交易中预测分析(in-transaction predictive analytics)解决方案,它允许用户在处理交易时部署和执行高级预测模型,帮助用户在影响最大的时候实时地预测终端用户需求、计算机风险或侦测欺诈。

基于Apache Spark推出的全新z/OS平台以及合作伙伴相关解决方案,可以让那些从不同来源采集数据的数据科学家和数据管理员用自己喜欢的格式和工具来收集和分析数据。

IBM去年发布了一项 针对Spark的承诺,将投入3500名IBM研究人员和开发人员参与与Spark相关的项目。为了推进支持大型主机分析的开源技术,大型主机还成了一个新的GitHub组织,以便开发人员协作建立针对Spark的z/OS工具。比如,Project Jupyter和任一NoSQL数据库的组合都能提供灵活、可扩展的数据处理和分析解决方案.

这一方法可以帮助件开发人员选择他们的工具和语言,提供能够在不同数据环境中监控分析结果的新型视觉辅助工具,开发出新的数据处理技术和技巧,从而让新的开源工具更易使用。

使用z/OS的开发人员现在已经可以下载基于Apache Spark的IBM z/OS平台。

本文转自d1net(转载)

时间: 2024-07-30 06:02:39

继续支持开源,IBM新型主机平台能够更好支持Spark的相关文章

ARM发布最新平台安全架构:支持碎片化物联网系统

世界互联网大会先进科技成果发布会上,ARM全球执行副总裁兼大中华区总裁吴雄昂发布了最新的平台安全架构,通过这样一个安全架构,不光是解决了安全架构的一致性问题,而且能够支持多样化.碎片化的物联网系统. 吴雄昂称,物联网系统的安全不仅仅在于设备,而在于网络.在于云.这里面有上百家芯片公司.上千家系统公司,同时有上百万的开发者,这个安全架构得到了从芯片.安全.系统.软件.云,一百多家科技公司的一致支持. ARM发布最新平台安全架构:支持碎片化物联网系统.jpg 以下是吴雄昂的演讲: 女士们.先生们,下

红帽与IBM作出了一次重大选择:全力支持开源虚拟化KVM

如今,企业都正在部署或已经实施虚拟化技术,以便提高IT基础架构的利用率和经济性.利用数据中心虚拟化,这些企业推动了关键应用程序的高可用性与快速恢复.最近几年,VMware.思杰和微软等虚拟化技术占据了数据中心大部分领地.但是,商用的解决方案不仅部署与运维成本昂贵,而且容易被厂商锁定.企业用户希望保持对IT的控制能力,确保底层虚拟平台具有开放性,并有一个强大的生态系统对其进行支撑. 红帽与IBM作出了一次重大选择:全力支持开源虚拟化KVM.KVM构建在Linux之上,本质上是将Linux内核转化为

支持开源 英特尔为云计算提供测试平台

本文讲的是支持开源 英特尔为云计算提供测试平台,[IT168 资讯]2009年10月12日,英特尔首席技术官贾斯汀在接受记者采访时表示,英特尔致力于多领域的研究,其中包括云计算.     贾斯汀表示:云计算是一个非常广泛的概念,涉及到很多方面.而英特尔有接近75%的业务与云计算相关.     英特尔很早就注意到,很多研究云计算的公司缺乏好的基础设施,英特尔要做的,就是为全球的云计算研究人员和机构提供一个好的测试平台,通过提供好的测试平台体现英特尔的价值.     贾斯汀称,英特尔一直致力于研究降

介绍IBM InfoSphere Streams平台的典型拓扑结构

本文特别适合流计算应用的开发人员阅读,对需要了解和设计流计算架构的人员也有很大的参考价值. 进入 21 世纪,由于处理器性能的大幅提升以及网络技术和应用的日新月异, 数据的传播和交换正经历革命性的变化.图灵奖获得者吉姆·格雷(Jim Gray)认为,网络环境下每 18 个月产生的数据量等于过去几千年的数据量之和.不仅如此,数据还具有实时.异构.非结构化等一系列特点.目前大多数数据分析平台如 Hadoop,采用离线计算的方式来处理具有上述特征的数据,耗费的时间少则数天,多则数月,极大地延误了业务决

加速区块链、混合云、开源领域创新 主机用户社区探索跨界合作

近日,2016中国主机用户社区(CDUG)暨中国主机客户理事会大会(zCCC)在京盛大召开.本次盛会由北京理工大学软件学院院长丁刚毅教授及IBM主机全球副总裁MikeDesens共同致开场演讲.大会齐聚主机科研高校代表.国内主要银行及交通行业主机用户代表.主机前沿技术专家,就主机最新技术趋势.行业应用案例及产学研合作项目进行分享与交流.借助CDUG开放的交流平台,本地企业客户.解决方案提供商和开发者与IBM主机相关负责人.北京理工大学主机科研团队进行深度对话,就IBM LinuxONE及大型主机

什么是OpenStack 开源的云计算管理平台项目_OpenStack

OpenStack是一个由NASA(美国国家航空航天局)和Rackspace合作研发并发起的,以Apache许可证授权的自由软件和开放源代码项目. OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作.OpenStack支持几乎所有类型的云环境,项目目标是提供实施简单.可大规模扩展.丰富.标准统一的云计算管理平台.OpenStack通过各种互补的服务提供了基础设施即服务(IaaS)的解决方案,每个服务提供API以进行集成. OpenStack是一个旨在为公共及私

TensorFlow 1.0 正式发布;微软开源无人机虚拟训练平台 AirSim | AI开发者头条

TensorFlow 1.0  正式发布! 在昨晚揭幕的 TensorFlow 开发者峰会上,谷歌正式发布了 TensorFlow 1.0 版本.新版本带来三大主要优化: 大幅提升的运算速度,尤其是对于多 GPU.分布式计算场景. 对高级别 API 有更好的兼容性,尤其完全兼容 Keras 改进 API 稳定性  注:本次峰会是 TensorFlow 史上第一届开发者峰会,在加州山景城举行,颇值得大家关注.详情请关注雷锋网后续报道. TensorFlow 1.0 详情:http://www.le

Erbix:兼容于 CommonJS 的服务端 JavaScript 主机平台

Erbix 为构建和部署 JavaScript 应用程序的云端平台.除了支持 RinjoJS,CommonJS 模块,PostgreSQL 外,还支持具可伸缩性的按需调配主机. Erbix is a platform for building and deploying JavaScript applications on the Cloud. It features support for RinjoJS,CommonJS modules, PostgreSQL and on-demand s

Terracotta v3.5.1发布 著名开源Java集群平台

Terracotta是一款由美国Terracotta公司开发的著名开源Java集群平台.它在JVM与Java应用之间实现了一个专门处理集群功能的抽象层,以其特有的增量检测.智能定向传送.分布式协作.服务器镜像.分片等技术,允许用户在不改变现有系统代码的情况下实现单机Java应用向集群话应用的无缝迁移.使得用户可以专注于商业逻辑的开发,由Terracotta负责实现高性能.高可用性.高稳定性的企业级Java集群. Terracotta公司目前在美国.欧洲.澳大利亚.印度等地有近百名员工,为Terr