搜索引擎如何优化?
上图中,上面是“货”,下面是“人”,大部分人只能看到“爆款”产品,但是有非常多的产品是无法看到的。所以我们通过优化搜索引擎,希望更多的、适合的产品展现在更多人的面前,但是效果不好。可是我们想了一个方法,在人群中先找到一个“达人”——所谓“达人”就是比比其他人更会挑选商品的人,TA们比人群中其他人的能力强,总能挑到物美价廉的商品。在大数据样本中,一般会有“达人”出现。定义了“达人”后,我们跟踪达人的行为,看TA是如何找到商品的?学习“达人”的搜索方式后,我们找到更多的好商品和店铺。然后我们会找到更多的“达人”,不断的寻找新的“达人”,但是必须要有足够的样本量,因为今天我是“达人”,未必明天还是“达人”。所以,流程如下图:
(1) 定义达人
(2) 侦测达人行为
(3) 发现特色长尾商品发现小而美卖家
(4) 揣摩达人决策
(5) 发现达人
大数据也有盲点
举个例子,今天早上我看到一件好的衬衫,上班后,在网上搜索,准备下单,这时老板找我去开会,我只能停止搜索。在会上,我觉得比较无聊,用手机继续搜索衬衫,结果看到广告,就花了100元买了一块手表。如果从后台数据分析会得出两个结论:(1)用户A在PC上搜索后,对那款衬衫不感兴趣(2)用户B在手机买了一块手表。如果不是这个人戴一个GoogleGlass,是无法还原真实的购物、浏览过程的,是不知道用户A和用户B是一个人,用户A并不是对衬衫不感兴趣,而是因为没有时间。所以,盲点是:以交易为核心而非以浏览为核心。
数据也有生命周期
数据是有生命周期的,不是所有数据都有用的,比如搜集一个关于网站浏览的数据,通常过了18个月,这个数据就没有用了。因为经过18个月,整个网站可能都变了。整改网站的变化会影响数据的生命周期。听说美国要做些法律改变,一个公司搜集个人的数据,只能保存最近6个月的数据。
最近的思考
(1) 数据开放还是不开放
(2) 数据存还是不存,如果存存多久?
数据十诫
(1) 好的问题、答案就在里面
(2) 在实践中提炼数据
(3) 让数据变成Technology,Enable更多人
(4) 让数据跟着“人”走
(5) 木有数据质量,神马数据都是浮云
(6) 以假设数据都能够获取去思考问题;
(7) 大数据安全,不是监管
(8) 利用数据拿到更多有用的数据
(9) 建立数据的数据,才有进步
(10) 让人做人擅长做的事、让机器做机器擅长做的事
趋势
DT:Data Technology
CI:Consumer Intelligence,就是以用户为中心的一种说法
原文发布时间为:2014-04-26