零售业如何用Hadoop开启大数据之门?

文章讲的是零售业如何用Hadoop开启大数据之门,在过去几年,全球零售商一直试图利用大数据创造价值。由于其大数据分析基础架构的限制,许多工作被一再推迟。Hadoop为这些零售商打开了新的大门,它可以解决他们在过去几年在大数据领域面临的许多问题和挑战。

  Hadoop:跨多门编程语言的大数据解决方案

  Hadoop背后的技术最初是由Google大约在10年前开发的。核心代码主要是用Java编写的,但有一些是用C编写的。然而,它运行在一个称为MapReduce的编程模型中,这允许开发人员用其他语言创建新的Hadoop代码。

  由于MapReduce环境可以接受不同的编程语言代码,因此它非常通用。它可以提取,分析和操作许多不同来源的大数据。它使用各种算法来进行关联规则学习,聚类,分类和回归。这些算法依赖于各种函数,包括贝叶斯,期望最大化和FP-Grown算法。

  Cloudera的首席执行官Mike Olson表示,Hadoop目前仍处于起步阶段,但它已经在塑造零售和金融领域厂商使用大数据的方式了。

  “Hadoop平台旨在解决大量数据(可能是复杂的和结构化的,并且不能很好地融入表中的数据)的混合问题。它适用于深度和计算量大的分析,例如聚类和定位...在在线零售中,如果想为客户提供更好的搜索答案,以提高用户的购买欲望,Hadoop可以很好地解决这一问题。

  Sears控股公司分部副总裁Aashish Chandra表示,Hadoop已经帮助公司降低了运营成本,提高了销售额。Chandra说,以前的大数据提取工具缺乏他们所需要的功能。

  使用Hadoop挖掘销售点大数据

  销售点数据在零售业中起着非常重要的作用。公司依靠销售点大数据来预测未来销售,管理库存和项目人员需求。

  有许多销售点工具可以聚合销售信息并将其存储在大数据集中。然而,零售商难以用常规工具从PoS中挖掘大数据,即使它就存储在SQL数据库中。Hadoop使零售商更容易从客户数据库访问信息,此数据可以转换为其他格式,并与其他文件中的数据集合并。

  New Horizons CLC的John Soto声称Hadoop是零售业主要的改变者。

  “大型零售商永远不可能利用其传统的大数据基础设施进行这种分析。存储如此多的历史数据是十分昂贵的,并且数据类型复杂,并且需要相当多的准备以允许它与PoS事务组合。Hadoop解决了这两个问题,并且可以运行比旧系统更复杂的分析。”

  Hadoop可以让零售商预测分析挑战

  Hadoop消除了零售商在利用大数据方面的一些障碍。这里有一些该技术带来的好处:

  1、数据挖掘能力强。许多零售商都存储了TB级别的数据。这些数据集往往难以提取,因为它们有很深的嵌套。Hadoop有非常复杂的索引算法,因此它可以提取以前无法为大数据应用程序使用的数据。

  2、与不同的数据格式兼容。零售商以许多不同的格式存储数据。内部财务数据通常存储在.csv文件中。零售商一直在努力进行审计,因为他们无法比较结构化和非结构化数据集的数据。Hadoop可以提取多种格式的数据,进行分析并以更具凝聚力的形式呈现,它使大数据分析专家能够从多个来源的数据集之间寻找相关性。

  零售商已经发现了使用Hadoop的好处:

  1、Staples使用Hadoop分析大数据和预测未来的销售,这有助于他们更有效地分配资源给人员和库存。 据报道,自使用Hadoop以来,Staples的促销成本降低了25%。

  2、亚马逊使用Hadoop来改进欺诈检测模型。据报告,他们将信用卡欺诈减少了50%,因为他们可以更容易地识别出信用不佳的人。

  3、相比之前,Brands可以得到更详细的客户信息,这有助于他们改进营销策略。使用Hadoop和预测分析的零售商的销售额增长了73%。

  零售商只是开始认识到Hadoop和大数据的潜力。根据DeZyre所说,Hadoop最大的优势之一是它可以帮助零售商实时识别和应对挑战。这对防止欺诈尤其重要,因为罪犯总是在考虑新的骗局。

  “操纵者总是在发明新的欺诈工具和技术,零售商必须使用零售分析来识别欺诈活动,防止它们再次发生。使用大数据技术(如Hadoop,MapReduce和Spark),可以对超过50 PB的数据执行分析,以准确预测潜在风险。”

作者:zyy

来源:IT168

原文链接:零售业如何用Hadoop开启大数据之门?

时间: 2024-11-01 13:55:38

零售业如何用Hadoop开启大数据之门?的相关文章

戴尔开启“大数据+”主题盛宴

引言 贵阳再发英雄帖,各路大数据专家共赴大数据盛宴.2016数博会以"数据创造价值, 创新驱动未来"为主题,发声全球将再次打造大数据行业盛宴.整体定位"国际化.专业化.高端化.可持续化"成为具有权威影响力的"国家级"盛会. 在未来5年到10年,中国大数据产业将迎来黄金增长期.2015年中国大数据市场规模达到115.9亿元,增速达38%,预计2016年至2018年将维持40%左右的高速增长--大数据究竟可以为我们的生活带来哪些改变?来数博会戴尔展台

阿里云释放数据能力 开启大数据元年

2016云栖大会·上海峰会召开,这也是暨北京.杭州.成都.武汉.广州等地之后的又一次阿里云的盛会.而此次大会上,阿里云将主题聚焦在大数据,不但发布了大数据平台数加,还发布了阿里企业级互联网架构平台解决方案,带领企业走向DT World. 开启大数据元年 数据是生产资料,这是阿里云一直在强调的,早在以前,我们都认为阿里巴巴是一家电商公司.互联网公司,而后有了支付宝.余额宝等金融产品,我们认为阿里巴巴是一家支付公司.还记得马云曾经说过,阿里巴巴其实是数据公司.的确,在阿里巴巴集团下的众多业务中,掌握

智汇数据 集聚价值 开启大数据财富大门

本文讲的是智汇数据 集聚价值 开启大数据财富大门,2012年8月16日消息,以"智汇数据 集聚价值"为主题的2012 informatica 全球巡展在京拉开帷幕.来自informatica的管理层与嘉宾深入探讨了IT产业的变革.数据集成的挑战和影响行业的发展趋势,并向国内用户全方位展示了informatica最新数据集成平台中的创新亮点. 大数据--企业的财富 当前,云计算.社交计算和移动计算等新技术正在颠覆着IT产业,这些趋势正在刺激大数据的爆发式增长--更大数量.更广泛的数据种类

Hadoop和大数据两个世界是合并还是冲突?

在数据库格式领域将会发生一场战争吗?Hadoop和大数据这两个世界在企业界会合并还是冲突?就在Janath Manohararaj以蓝十字蓝盾协会(Blue Cross and Blue Shield Assoc.:美国第一大私人健康http://www.aliyun.com/zixun/aggregation/6173.html">保险公司集团----译者注)数据库服务团队负责人的身份作客SiliconANGLE的流动新闻平台CUBE之前,他与CUBE的搭档主持人John Furrier

微软开启大数据平民化时代 每个人都能当Mr.Big

我们的城市中有一位Mr Big,他是如此的巨大以至于拥有改变世界的力量,他能够看到正在发生的一切,能够预知将要发生的未来,帮助我们创造动人的惊喜,它能够看到发生的一切--有了大数据,谁都可能成为Mr.Big. 图为微软全球高级副总裁,大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)在微软大数据战略发布会上演讲 上面这段话摘自昨天微软在北京发布其大数据战略时现场播放的一个短片,这个短片形象.直观地展示了大数据的魅力所在.与其他厂商不同的是,微软大数据战略强调利用简单的工具来实现大数据

IDF2013:英特尔超越Hadoop的大数据

[IT168 专稿]2013年4月10日消息,2013年英特尔信息技术峰会(IDF 2013)在北京国家会议中心举行,本届IDF主题为"未来,用"芯"体验",宣示英特尔更加以用户体验为核心,立足英特尔架构继续扩大和深化产业合作,全面推动计算技术创新.芯片制造创新.应用体验创新.终端形态创新和云端智能创新,以强大的计算力开启一个全新的个性化体验新时代.来自中国和全球各地的数千名软硬件开发人员.技术管理人员及媒体.分析师将汇聚一堂,体验前沿的技术成果,探索未来的创新趋势

hadoop处理大数据视频的问题

问题描述 hadoop处理大数据视频的问题 我有一段治安监控视频1个G大小,我现在想通过算法计算出视频里全部的有移动物体的目标片段,但是单台机器任务计算非常慢,我是否可以通过Hadoop实现快速计算,具体的流程是什么样de ?谢谢 解决方案 把视频文件通过hadoop fs put放到集群上,然后通过集群来进行元算 解决方案二: 首先放到hadoop集群里,然后编写mapreduce程序 解决方案三: 大数据处理之hadoop(一)

《Hadoop海量数据处理:技术详解与项目实战》一1.2 Hadoop和大数据

1.2 Hadoop和大数据 Hadoop海量数据处理:技术详解与项目实战 在人们对云计算这个词汇耳熟能详之后,大数据这个词汇又在最短时间内进入大众视野.云计算对于普通人来说就像云一样,一直没有机会能够真正感受到,而大数据则更加实际,是确确实实能够改变人们生活的事物.Hadoop从某个方面来说,与大数据结合得更加紧密,它就是为大数据而生的. 1.2.1 大数据的定义 "大数据"(big data),一个看似通俗直白.简单朴实的名词,却无疑成为了时下IT界最炙手可热的名词,在全球引领了新

基于Hadoop的大数据企业前十大集合

超人气Hadoop初创公司前两名 这已经不再是什么秘密了,全球的数据正在以几何数字增长,借助这股数据浪潮在全球范围内迅速成长起来一大批Hadoop的初创型公司.作为Apache的一个开源分支Hadoop几乎已经成为了大数据的代言词.据Gartner估计,目前的Hadoop生态系统市场价值大约为77,000,000: 该研究公司预计,这一数字到2016年将迅速增加到8.13亿美元. 在Hadoop市场快速发展的大环境下,出现了大量的初创型企业来分这将近十亿美元的大馅饼. 1.Platfora 他们