全球领先的商业分析软件与服务供应商SAS公司正在开发一种基于SAS内存分析技术,并适用于开源框架Hadoop的交互式分析编程环境。新软件通过更快地挖掘大数据获取更精确商业洞察,帮助企业提升盈利、降低风险、增进对客户的了解以及创造更多商业成功的机会。
SAS?In-MemoryStatisticsforHadoop能够让多用户同时并交互地管理、挖掘和分析数据,建立和比对模型,以及对Hadoop框架内的海量数据进行评分。Hadoop开源框架被广泛认为是大数据未来发展方向。SAS软件将在2014年上半年内帮助数据科学家大幅提高工作效率。
“SAS?In-MemoryStatisticsforHadoop可单次载入Hadoop数据并将其保存到内存中供多用户进行一个会话内的多类型分析,相比之下,其他需要将数据写入磁盘的方式面临的问题是:所有的数据传输对于大数据处理而言都是极其低效的。”SAS分析服务器研发部门高级总监OliverSchabenberger表示,“我们正致力于帮助数据科学家、建模师和统计员减少使用多种分析编程语言,摆脱各种工具混合使用的繁琐。SAS?In-MemoryStatisticsforHadoop支持所有类型的数据分析,为协同分析开辟一条快速、强劲和综合的途径。”
SAS?In-MemoryStatisticsforHadoop支持的统计和机器学习建模技术包括:聚类、回归、广义线性模型、方差分析、决策树、随机决策森林、文本分析和推荐系统。SAS可视化分析(SAS?VisualAnalytics)采用的内存分析技术也被应用到SAS?In-MemoryStatisticsforHadoop中。SAS内存架构为数据分析提供前所未有的速度—这对于在海量数据中挖掘价值来说必不可少。
为什么选择Hadoop?
市场研究机构IDC预测到2016年,Hadoop将实现8.128亿美元的销售额—复合年增长率达到60.2%。SAS期望客户能够借助Hadoop继续将大数据转化为卓越洞察。
“Hadoop对累积了海量数据资产的企业来说意义非凡。SAS致力于帮助这些部署大数据架构的企业,运用行业最顶尖的分析技术实现大价值,”SAS首席数据科学家WayneThompson表示,“在大数据理念大热之前,SAS便开始着力于服务大数据用户。随着技术的发展,我们也不断满足变化的客户需求,实现客户所想。”
他还提到SAS与Hadoop生态系统中知名公司Cloudera和Hortonworks进行了战略合作,使客户在受欢迎的Hadoop分布中有机会使用行业领先的分析技术。
Hadoop可以在商业服务器集群上分布数据和执行并行处理,还能侦测和处理对于分布式处理至关重要的故障。Hadoop除了具备低成本分布式硬件和数据冗余安全模式之外,还拥有以下一系列显着优势:
l并行处理—Hadoop分布式计算模型拥有海量数据处理能力。
l可扩展性—可通过添加节点轻松扩展Hadoop系统。
l存储灵活性—与传统的关系型数据库不同,数据无需为存储进行预处理。Hadoop能够轻松存储非结构化数据。
SAS公司大中华区总裁吴辅世先生表示:“大数据的兴起促成了底层开源Hadoop技术的繁荣。我们也看到了Hadoop蕴含的潜在商机,它成本更为低廉、部署更为简单、能够存储文本等非结构化数据,可满足企业所需。目前,Hadoop在国内的应用愈加广泛,尤其是在电信业和金融业。SAS希望能够在Hadoop中引入强大分析技术,帮助企业从Hadoop部署中获取价值。”