大数据不神秘,一文读懂大数据是怎样在为你服务的

  马云最近谈云端服务,阿里巴巴最近就在搞大数据峰会。事实上,无论云端服务还是大数据,概念都很虚,但是具体如何产生商业价值,如何被我们在生活上所用,才是真正的王道。——吐槽在前面的话。

  言归正传。

  每个人都在说大数据,这似乎是一个很时髦但又很有距离感的词。但是,你知道吗,你的每一个行为,都将运用到大数据,也都将组成大数据的一部分。

  例如,">2014年春天的某一日,你刚刚看完《来自星星的你》,开始对女主角的衣着打扮念念不忘。于是,你终于忍不住打开了淘宝,但是由于偷懒,你只输入了几个字:“全智贤”。

  没错,接下来,你将看到一大堆有关你喜欢的大衣、包包、发饰、口红等。但是你知道,在你的这一个搜索背后,数据是怎么为你服务的吗?

  首先,你的这几个字,会被翻译成机器能听懂的语言。这样,数据先森才知道你想要什么。

  知道了你要什么,接下来,他就要在自己的库里面掏出你想要的东西。

  在没有大数据的概念之前,也许他掏出来的是

  

  或者是

  

  如果是这样子的话,你需要翻上好几页,才能看到一个你想要的大衣或者包包。

  但有了大数据之后,数据先森会先把根据你以往的购物经历,来判断你是一个什么人:

  1、奇怪,你个人资料明明填的是“男”,为什么买的都是女性用品?卫生巾、bra、吊带袜。好吧,你一定是想忽悠数据先森。但是很遗憾,数据先森认定,你就是女汉纸!

  2、你之前买的都是欧美风格的衣服。那么,有关日韩小可爱的衣服就不给你了。

  3、咦,原来你穿的都是XL号的呀?看来,只有大码的才适合你。那些小号衣服都靠边站吧。

  4、不好意思,知道你的年龄了……30岁,正当年!上个大气的风衣。

  5、你最近是不是迷恋起彩妆了?买了这么多眼影和粉底,给你配个口红吧,千颂伊款哦!

  6、呀,你不喜欢圆领的吗?那再给你去掉。

  7、再来看看,跟你有相同品味的人,她们买了什么?

  嗯,应该差不多了?不,别忘了,你是来自上海的亲,为了省点运费,优先给你看本地的卖家。

  这样一大串下来,数据已经自己先帮你筛除了一大堆你不需要的东西,并且把适合你的自动优先匹配。

  你以为这样就算结束了?当然不是,数据先森还要掐指一算,按照往常,这个时间你应该是跟男朋友去吃饭了。为什么今天没有去吃饭而是来上网了?难道分手了,心情不好?还是男朋友在加班?总而言之,数据先森需要给你一点正能量,优先提供给你喜欢的店铺,并且告诉你,它们降!价!啦!

  Ok。也许到现在,你终于明白了大数据是怎样在为你服务的。那么,在体验完这个服务之后,恭喜你,你又添上了新的一笔数据。

时间: 2024-08-28 00:01:47

大数据不神秘,一文读懂大数据是怎样在为你服务的的相关文章

【2017最佳机器学习论文】AlphaGo Zero最赏心悦目(一文读懂大咖论文)

前几天与杨静老师和刘江老师,讨论 2017 年人工智能进展时,没来得及说 2017 年最值得读的论文. "什么是最值得读的论文",这个话题,仁者见仁智者见智. 下面,说说我个人觉得今年收获最大的论文: 最赏心悦目:Mastering the Game of Go without Human Knowledge 最有实践价值:Attention Is All You Need 和 One Model To Learn Them All  最有研究潜力:Superhuman AI for

一文读懂大数据的黄色小象帮手——Hadoop

继云计算之后,大数据(Big Data)接棒成为最热门的科技潮字,和大数据有关的技术和科技接二连三成为科技圈注目的焦点.如果你也关注云端跟大数据的资讯,Hadoop 这个字出现频率一定挺高的,这个黄色小象 Logo 也应该经常亮相. 究竟 Hadoop 是什么?能够用来解决什么问题?又为什么重要?比起解释一大堆技术上的细节,倒不如把重点放在 Hadoop 处理巨量资料的角度切入了解,看 Hadoop 能够带来什么好处,同时也从这个方向反过来理解大数据. Hadoop 的雏形 Nutch 最初是由

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

前言 时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的"云梯"是当时国内名声显赫的计算平台. 这一年,Hadoop的好兄弟HBase由毕玄大师带入淘宝,开启了它的阿里之旅.从最初的淘宝历史交易记录,到去年的支付宝消费记录存储在线历史存储统一:从蚂蚁安全风控的多年存储演进,到HBase.TT.Galaxy的大数据激情迭代:HBase在阿里经历过年轻的苦涩,释放过青春的活力,也付出过成长的代价.几代人的不懈努力下,五年陈的HBase开始表现出更成熟.更

一文读懂大数据计算框架与平台

1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等.随着互联网.物联网等技术得到越来越广泛的应用,数据规模不断增加,TB.PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务.而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多. 举一个简单的例子,假设我们要从销售记录中

【独家】一文读懂大数据计算框架与平台

1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等.随着互联网.物联网等技术得到越来越广泛的应用,数据规模不断增加,TB.PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务.而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多. 举一个简单的例子,假设我们要从销售记录中

独家 | 一文读懂大数据处理框架

前言 说起大数据处理,一切都起源于Google公司的经典论文:<MapReduce:Simplied Data Processing on Large Clusters>.在当时(2000年左右),由于网页数量急剧增加,Google公司内部平时要编写很多的程序来处理大量的原始数据:爬虫爬到的网页.网页请求日志:计算各种类型的派生数据:倒排索引.网页的各种图结构等等.这些计算在概念上很容易理解,但由于输入数据量很大,单机难以处理.所以需要利用分布式的方式完成计算,并且需要考虑如何进行并行计算.分

十种程序语言帮你读懂大数据的“秘密”

文章讲的是十种程序语言帮你读懂大数据的"秘密",随着大数据的热潮不断升温,几乎各个领域都有洪水倾泻般的信息涌来,面对用户成千上万的浏览记录.记录行为数据,如果就单纯的Excel来进行数据处理是远远不能满足的.但如果只用一些操作软件来分析,而不怎么如何用逻辑数据来分析的话,那也只是简单的数据处理. 替代性很高的工作,而无法深入规划策略的核心. 当然,基本功是最不可忽略的环节,想要成为数据科学家,对于这几个程序你应该要有一定的认识: R 若要列出所有程序语言,你能忘记其他的没关系,但最不能

【图解】九张图带你读懂大数据医疗

文章讲的是[图解]九张图带你读懂大数据医疗,互联网大框架的结构下,互联网+医疗的个性化服务,能给医疗保健工作者和消费者带来哪些真正的福利呢,首先可以提高效益减少废物.增强了预防传染病的能力.对于个人公共卫生.疾病预防和治疗都有很大的帮助.医学的临床试验等等工作,都在造福于我们. 人们都想选择个性化的健康医疗,为了实现这个目标,我们必须让大数据参与到破译和分析个人的所思.所需中.除了作为一个行业的流行语以外,大数据可以为医疗保健工作者和消费者带来怎样的成功呢? 下面的信息图是由Evariant公司

一图读懂大数据生态 大数据地图3.0

文章讲的是一图读懂大数据生态 大数据地图3.0,2012年,FirstMark资本的Matt Turck绘制了大数据生态地图2.0版本,涵盖了大数据的38种商业模式,被业界奉为大数据创业投资的清明上河图.两年后的今天,经过漫长的等待,Turck终于推出大数据生态地图3.0版本.(期间bloomberg推出过一个2013版大数据生态地图) 在大数据生态地图3.0版中,Turck从一个风险投资者的角度对两年来大数据市场的最新发展进行了深入的研判,并对未来趋势进行解读,以下是Turck眼中大数据市场的