文章讲的是IBM:更快驱动大数据分析 降低难度成本,IBM在大数据方面推出全新技术实现了大数据分析的加速、优化和开源选择:
业内首创BLU Acceleration技术, 极大程度加速分析的性能,令报告生成和数据分析速度提升25倍,查询速度比以往快1000倍以上
创造企业级开源Hadoop产品---PureData for Hadoop, 强大的专家能力简化分析系统的部署和运营,加载时间从数周减少到数分钟
增强数据库—DB2 10.5新版本
近日,IBM(NYSE: IBM)正式发布最新大数据技术,包括业内首创的BLU Acceleration和全新大数据专家PureData for Hadoop。作为IBM全球数百位顶尖研究人员智慧结晶,这些创新能力将进一步帮助企业和政府应对大数据浪潮,有效降低大数据分析的难度、用时和成本。
IBM全球副总裁兼大中华区软件集团总经理胡世忠先生表示:“面对计算机、移动设备、传感器和社交网络产生的结构化和非结构化数据洪流带来的巨大挑战,企业正承受着前所未有的压力,并努力探寻降低海量数据的分析成本和提高分析速度的方法,从而深化客户关系,规避风险和诈骗,同时寻找新的业务机遇。大数据就是要有效利用对企业产生影响的所有数据,IBM希望利用更多的创新产品,为更多企业和机构驱动大数据价值,通过新技术实现数据的快速挖掘与分析,从而提升业务表现。”
PureData for Hadoop:开源+专家能力=优化
IBM正式推出面向Hadoop的全新IBM PureData系统PureData for Hadoop,旨在提高企业部署Hadoop的速度,同时降低部署难度。Hadoop作为颠覆性的开源软件,可用于组织和分析海量的结构化和非结构化数据,例如社交媒体网站的微博与评论、图片和视频、网上交易记录和记录手机定位数据等。
全新PureData for Hadoop让企业在使用企业级Hadoop技术时的加载时间从数周减少到数分钟,而且还为商业分析师和数据科学家提供易用、功能强大的分析工具,并为其呈现可视化效果。此外,新系统还提供了功能更强大的大数据工具,可用于监测和研发,同时加强版的大数据工具可以与更多企业系统相兼容。
IBM PureData for Hadoop标志着IBM在其总体战略中迈出了新的一步,该举措旨在提供一系列具备嵌入式专业功能的系统,充分彰显了IBM在降低信息技术成本和复杂性方面的数十年经验。该系统集成了IBM的InfoSphere BigInsights,该软件帮助各种规模企业实现数据低成本、高效率的管理和分析,并且增加了便捷管理、流程化、资源配置和安全性特征,上述特性与IBM研究院一流的分析功能有效结合在一起。
客户例证:
凯利蓝皮书(Kelley Blue Book:www.kbb.com)是业内领先的新车和二手车信息供应商。其将采用PureData for Hadoop分析网站用户带来的点击流数据。该公司能够有效分析信息,包括社交媒体数据,以便了解网站访客最关心的内容,例如二手车和新车价格、事故报告、安全召回事件、保修情况以及汽车买家评论。
凯利蓝皮书技术与数据智能部门副总裁Steve Chow如是说道:“凯利蓝皮书从不同来源收集海量数据,有效的数据管理和分析对我们业务的增长十分关键。我们发现PureData for Hadoop具有广泛用途,可将其作为战略平台去扩大公司的分析生态系统,充分挖掘社会化媒体、文本和机器数据的价值,从而更加深入地了解我们的消费者和客户,改善他们在KBB.com上的综合用户体验。”
BLU Acceleration:为数据库注入全新力量,加速分析
BLU Acceleration整合了大幅改善分析能力和简化管理的一系列技术,能够将报告生成和数据分析速度提高25倍。借助BLU Acceleration,用户可以更快速地抓取关键信息,从而做出更好的决策。该技术延续了传统的内存管理系统的功能——通过内存效能,甚至当数据量超出内存容量时——也使数据更快捷地下载到随机存取存储器上,而不是硬盘上。在测试过程中,结合使用BLU Acceleration的创新功能,很多查询功能在单项分析负载中运行速度比以往要快到1000倍以上。
BLU Acceleration的革新技术包括了“数据忽略(data skipping)”,即略过那些分析中不需要的数据,比如重复性的信息。它还可以分析跨处理器的并联数据,并且不通过开发数据建模的隔离层,便可更直接地对应用程序进行数据分析。BLU Acceleration另外一个显著优势叫做“可行性压缩(actionable compression)”,可以让数据在整个分析过程中保持压缩状态。
客户例证:
BNSF铁路公司是北美地区最大的货运铁路运输公司之一。该公司正在采用IBM BLU Acceleration,以更快地了解该公司1700台服务器产生的海量数据,这些服务器追踪记录维护、气象、调度,库存、安全、交付等信息。BNSF的业务分布于美国的28个州和加拿大的两个省,每天运营超过1,400辆列车,运营总里程为32500英里。
“美国当地以及世界各地的人们每天都在使用BNSF运送的众多产品和材料,所以如何追踪这些货品对于公司而言起着至关重要的作用。”BNSF铁路公司数据库解决方案架构师Kent Collins先生表示,“凭借与IBM开展的合作,我们现在可以轻松分析公司的大数据信息。得益于这项新技术,公司执行任务的速度比以前更快,例如查询速度提高了100倍以上,存储消耗却减少到原来的十分之一。BLU Acceleration的便捷操作让我们尤其欣赏,操作时只需要加载数据和运行查询即可。”
IBM创新大数据解决方案:让大数据处理变得简易方便,更适合企业应用
IBM针对大数据发布的新产品进一步扩展了业内最强大的大数据技术和解决方案组合,涵盖了软件、服务、科研和硬件。IBM大数据平台整合了传统的数据仓库技术和全新的大数据技术,例如Hadoop、流计算、数据探索、分析和企业集成,以期创建综合性解决方案来满足用户的关键需求。除BLU Acceleration和PureData for Hadoop之外,IBM最新发布还包括多个大数据解决方案版本更新:
新版InfoSphere BigInsights,这款企业级Hadoop产品可以利用现有的SQL技术,更便捷地开发应用组件。同时,它还具有安全性强和高可用性特点,这两点对企业应用来说至关重要。BigInsights提供了三个接入点:免费下载、企业软件和目前的专家级集成系统,即IBM PureData for Hadoop。
新版InfoSphere Streams,这款独特的流计算软件可以实时分析海量的动态数据,不仅功能更加强大,其应用程序的开发和部署也更加简单。
新版Informix,含TimeSeries Acceleration,适用于智能仪表和传感器数据的运行报告和分析。
作者:李焕珠
来源:IT168
原文链接:IBM:更快驱动大数据分析 降低难度成本