从来没有在哪个沙龙,哪个论坛里听到过这么多关于CIO对大数据探索的爆料。当然,我们并不是秘密的窥视者,只是希望将各种好的或者相对来讲不那么成功的经验进行分享。(受嘉宾委托,过于劲爆或者涉及商业机密的内容不在此呈现。)
本期企业网D1Net采访到的嘉宾包括:新毅金融CIO肖鹏、易观智库CTO郭炜,中国大数据专家龚才春博士,优客工厂首席数据官、产品开发总监、前百度大数据运营部创建者范宇,现京东技术学院院长吕建伟。他们将从自身经验出发告知我们,在大数据探索过程中所面临的困难及部分解决办法。
优客工厂首席数据官范宇:数据是死的,我之前在某大型互联网做了很多领域的探索,比如医疗,比如车联网,比如商业WIFI等等。在医疗行业,当时我们把某医院所有的档案数据拿过来,发现根本没有用,充其量只能做一个BI分析,告诉你犯哮喘病人的性别分布,一点预测能力都没有,因为它的数据样本太小了。但是,想要完全获得这个样本需要跟所有医院合作,拿到至少60%以上的数据采集,这显然不可能实现。
这家大型互联网公司当时还花过大价钱买了微博的数据,希望通过微博的数据打通与社交化的联系,结果发现买过来之后,花了这么多钱的微博数据其打通率只在1.4%。还比如商业WIFI,各种咖啡馆、餐馆,虽然数据量非常大,但其获得的数据却非常零碎,而且各地局域网的接入方法不一样,要打通这样的数据也非常难,投入也相当之大。因此,互联网公司的大数据探索其实走了很多弯路,唯一找到的比较好的切入点是智能电视OTT领域,打通非常容易, PC端打通率在50%左右,移动端打通率在75%,这样才可以产生商业价值。
目前大数据的主要用途在营销端,通过与移动端打通,就可以知道消费者看电视的行为方式,知道这个消费者平时在搜索什么,从而可以更好地在智能电视上推荐投放更多的广告。
优客工场是一家提供全要素、社区化的联合办公空间的创业公司,楼宇或者办公室出租与住宅是不一样的,首先商业写字楼与住宅不一样;第二、销售与租赁也是两回事,很难做到业务预测。比如消费者可能在夏天买一身羽绒服,因为反季购买比较便宜,但并不会因为冬天要去滑雪,但在夏天就提前租一个雪橇,因为一般都是在滑雪场现场租用,不会提前租。所以,优客工场面临的很大压力就是在场地正式装修好开业前提前出租,因为优客工场做的是T0B市场,因此采取了一些精准手段,利用了百度的一些资源、人脉,花5万块钱购买了一个百度大数据营销平台的账号,用关键词看这些创业者、小微企业、企业主都关注些什么,从而精准优客工场的办公服务。另外,还通过SNS、旅游等线索进行精准线上营销,以在前期就吸引到大量的客流。再具体就是商业机密了!
京东技术学院院长吕建伟:京东的广告投放最主要在线下,京东也曾经尝试过数据互换和数据交易,但是发现这条路根本走不通。京东现在通过业务合作获得数据流通,也就是纯粹购买数据这条路是死的。京东的活跃用户,也就是一个月在京东上做一次消费购买完成的活跃用户是1.4亿。京东在大数据精准方面还没有到人工智能、神经网络、深度学习等程度。但使用了大量的统计方法,以及在搜索方面的精准搜索、精准推荐,通过给数据打标签来实现。
中国大数据专家龚才春:中国大数据的首要问题是数据孤岛问题,新浪微博每天有一亿到两亿条博文发出来,即使新浪与淘宝可以实现账号互通,其数据打通率也不超过10%。新浪曾探索过场景搜索,就是对人打标签,给五亿人打标签,包括兴趣,爱好,谁在发博文,博文的内容,以及在什么地方什么时间发的博文等等。
很多企业都将大数据用于营销,但我认为在互联网行业不应该这么理解,互联网的每一个环节都可以用大数据,而不仅仅是用作营销。其正的大数据应该做什么?比如福特,它的每台发动机都可以检测发动机的数据,通过检测发动机的数据,就知道这个汽车大概什么时候会坏,能够卖多少钱,应该上多少钱的保险。所以,它跟金融,跟危机都可以联系起来,不仅仅是营销。
在人力资源行业,大数据也可以得到很好的应用,把一个合适的候选人推荐给一个合适的公司的一个合适的岗位,这是人力资源关注的事,但现在很少有招聘网站做得好,就是没有大数据,没有画像。大数据在人力资源领域的应用,通过对所有人,所有公司,所有职位进行画像,将一亿多人的简历进行搜集画像,最后实现大数据挖掘。未来应该是什么公司什么时候招人,需要招什么样的人,甚至应聘者的简历哪部分是虚假的都可以识别出来,形成一个精准匹配。
易观智库CTO郭炜:做大数据第一件事不是先搞技术,而是先懂政治。大数据平台得先把数放进来,而这些数据可能会损害某些利益集团的利益。CIO需要借势将背后的利益关系分析清楚,通过自己的影响力把大数据建立起来,数的来源需要政治的博弈才能达到。
第二, “数”可比作石油,原因在于大数据中可能有80%到90%的数据是没用的,数据如何变现?从大数据的角度来讲属于后台部门,而变现的则是产品部门和前端业务部门。
大数据变现目前来看有三种模式,一个是分析报告,一个是金融类的征信,另外就是营销。
新毅金融CIO肖鹏:我没做过大数据技术,但是现在在用大数据的应用,我们用的是反欺诈跟征信的结果,比如我要借款,通过我的平台发起借款请求以后,就会把个人的一些信息传递到后台的大数据平台上。它产生了多个纬度的一些数据,比如它有社交属性的数据,微博和微信、门户网站等,以及不同场景下的消费记录,甚至和社保的数据打通。当我们发送一个请求后,应用会生成一个报告,从而提高效率及风险控制能力。现在的互联网金融应包括三块技术:一是区块链技术,其次是大数据征信分析,最后是生物识别技术,这三大技术未来将对金融产生革命性的影响。
现在的传统银行,为什么不能做小额信贷?因为它做一笔小额信贷的成本和做一笔几百万,上千万的成本是一样的,都是靠人工的方式来做。但通过区块链技术在金融行业的应用,区块链是去中心化的,只要有消费,便会被记在这个记账体系里,可实现有效的反欺诈。比如同一个人如果在很短期里面频繁的借款,基本上这个人欺诈的可能性比较高。还可以根据他每个月的电话记录,电商的购物频度以及其它消费行为,根据上述画像,便能预测其信用额度。
本文转自d1net(原创)