北大教授王汉生:大数据被神化

  近来,大数据不断被提及,成为了一个热门概念。

  企业纷纷宣称自己的大数据能力很强,但网民被推送的“精准广告”常常是没用的垃圾信息处理。中国企业的大数据能力究竟如何?大数据方便了生活,也带来了隐私和安全风险,其边界在哪里?

  6月12日,就大数据的热点问题,新京报记者和北京大学光华管理学院商务统计与经济计量系教授王汉生展开对话。

  王汉生

  北京大学光华管理学院商务统计与经济计量系教授,博士生导师,系主任。北京大学商务智能研究中心主任。博雅立方科技有限公司首席科学家。微信公众号“狗熊会”创始人。1998年北京大学数学学院概率统计系本科毕业,2001年美国威斯康星大学麦迪逊分校统计系博士毕业。美国统计协会2014年会士(Fellow)。他主要研究高维数据分析,统计学在电子商务领域的应用等,尤其关注网络数据和位置轨迹数据的统计分析。

  ■ 核心观点

  大数据分析并非新奇概念,大数据能力提升的挑战是随着技术进步而产生的新的数据类型,包括中文文本,网络结构,位置轨迹等,需要建立全新的分析模型;国内行业中,边际利润较低的电商利用大数据发展空间有限,但传统制造业利用大数据前景非常好;国家需要对大数据带来的隐私风险进行规范,需要平衡行业与个体的利益。

  大数据更像是一个口号

  有些企业赶时髦,强调自己是做大数据的,但其实他们的数据分析能力惨不忍睹

  新京报:最近,大数据概念炙手可热,很多企业包括上市公司都在谈大数据。你如何看待大数据这个概念?

  王汉生:这不是一个严格的学术定义。它更像是一个口号,一种公共宣传的需要。随着技术的进步,大数据有一定的实质性变化。例如:产生了新的数据类型,达到了一定的量级。但是也有不少被神化的地方。比如原来金融投资的数据就很大,也在实际应用中有体现,只不过当时没有人关注。

  新京报:现在很多企业都宣称其数据已经达到一个新的量级。

  王汉生:有些企业以前是做物流的,有的是做3C的,现在它们都在赶时髦,强调自己是做大数据的,但其实它们的数据分析能力惨不忍睹。过去是什么样,现在还是什么样。当然也不排除其中有不错的企业,自始至终注重从数据产生价值。

  汽车等产业大数据发展空间更大

  我看好家具、汽车等这些利润率不错的传统产业,他们未来利用大数据的空间很大

  新京报:现在国内宣称大数据能力最强的是电商行业。有报道说电商现在可以做到用户一登录,他们就能判断用户需要什么,从而提前发货,将用户想买的东西送到。现实中有实现的吗?

  王汉生:这是很难实现的。对于极小部分购买行为非常有规律的人,他们的购物需求是可预测的。但是在多数情况下,消费者的购买行为是高度不可预测的。个性化推荐存在了这么多年,商品推送变为顾客的购买行为的转化率一般也就百分之几,如果能到百分之十已经是非常高了。毕竟数据分析只是描述市场和消费者的行为,并不会帮助人做决定。

  新京报:国内电商现在利用大数据主要还是在商品页面的个性化推送方面。你认为做得如何?

  王汉生:页面推送的成本非常低,不涉及物理上的搬运,它的边际成本几乎是零。这方面国内做得越来越好,个别情况下转化率可以做到百分之十。这个过程中不仅仅涉及算法精确问题,还要考虑网站整体的服务质量。

  新京报:未来国内电商进一步提升利用大数据能力的空间有多大?

  王汉生:我不看好电商行业,因为电商行业的边际利润已经很低了。我看好家具、汽车等这些利润率不错的传统产业,以及基金保险等传统的金融行业。他们未来利用大数据的空间很大。另外一个很大的大数据的利用方向是营销相关的,为中小企业解决广告投放困难的服务。

  新京报:怎么利用大数据帮助中小企业解决广告投放难题?

  王汉生:中小企业做在线营销优势不大,一个只面向方圆几公里内顾客的咖啡厅没必要到门户网站或者电视台上去做广告,小企业也买不起这样的广告。他们需要精准定位的广告。利用LBS(基于位置服务)工具产生的大数据进行定向营销的空间很大。但现在的问题是,基于用户位置的营销平台越来越多,中小企业筛选成本很高。

  “便利”与“隐私”需平衡

  隐私保护管得太松,网民隐私得不到保护;管得太紧,企业的创新受限

  新京报:尽管大数据潜力巨大,但也给个人和企业的信息安全带来风险。

  王汉生:现在我国,甚至全球范围内,法律对隐私保护的界定是不够清晰的,缺乏统一认识的。例如网民在电商浏览商品的记录,是网民的,还是电商的,还是网民和电商共有的?现在无定论。欧洲对个人隐私这方面的监管是非常严格的,但这也限制了欧洲的互联网企业发展。美国对这方面的监管相对松散一些,中国也还在学习摸索的阶段。但隐私保护这一刀切在哪里还没有结论,管得太松,网民隐私得不到保护;管得太紧,企业的创新受限,行业发展受限。所以,我们享受了互联网带来的便利,也需要让渡一些隐私的空间。但是,具体需要让渡多少,需要国家、企业、个人的逐步理解沟通。

  新京报:现在数据分析对人的识别可以准确到什么程度?

  王汉生:我不确信中国在这方面的这种分析能力。根据公开的文献,在美国只要提供邮编、性别和出生年月,87%的人就可以被独立识别出来。目前企业可以通过一个人的购买行为,识别到独一无二的一个虚拟人,企业可以知道这个虚拟人的很多喜好,但这个人叫什么名字,做什么的,一般情况下,企业还是不知道的。普通的企业,也没有动力去知道。但如果有好事者,把电商获取的数据和其他数据对接,就能识别到具体的人了。所以隐私保护还是非常重要。

  新京报:现在智能手机安装的软件,不少都要求获取大量权限,有的甚至要求有监听通话和短信的权限,这些软件对个人资料的大范围收集是有必要的么?

  王汉生:我不了解这些行为背后的动机。据我对行业的了解,大多数企业拿回去,啥也干不了。

时间: 2024-09-20 12:21:09

北大教授王汉生:大数据被神化的相关文章

大咖 | 王汉生:从数据到价值的转化,回归分析的“道”与“术”

学过统计学的同学们都知道一件事情,回归分析师数据分析的一个非常重要的模型方法.而且这些模型很可能是线性的.非线性的,也可能是参数的.非参数的,甚至是一元的.多元的,低维的.高维的,不尽相同.所以,把数据转化为价值,需要一个非常重要且精妙的思想方法:回归分析. 另外,这些都是在"术"的层面讨论回归分析.除了"术",回归分析还有一个更高的"道"的层面. 回归分析的"道" 在这个层面,回归分析可以被抽象成为一种重要的思想.在这种思想

哈佛教授用3个大数据案例告诉你:大数据,重要的不是数据!

 "满城尽谈大数据",但很多人其实并不理解大数据真正价值是什么,哈佛大学Gary King教授用3个大数据研究案例告诉你:有数据固然好,但是如果没有分析,数据的价值就没法体现. 2017年初,哈佛大学政治学系教授加里·金(Gary King)在上海交通大学举办了一场名为<大数据,重要的不是数据>(Big Data is Not About the Data)的讲座. 主讲人Gary King是哈佛大学的校级教授(University Professor).King教授以实证

对话知乎王雨舟:大数据时代,人都在“裸奔”吗?

文章讲的是对话知乎王雨舟:大数据时代,人都在"裸奔"吗,从大数据时代开启的第一天起,我们的生活注定被数据灌满了.这是一个人人都需要隐私但又不懂得在乎和保护隐私的时代,几乎所有人都在发布数据,把它们挂在网上或传播到公共平台.人们既向外发散,又向内吸收,自觉或不自觉地收集各种各样的数据信息.--<大数据在中国> 人们不禁发问:大数据时代,人都是在"裸奔"吗? 知乎,作为一个知识社交平台,目前拥有8400万注册用户,每天产生的数据量多得惊人.这些传来传去的信息

王洪涛:大数据技术的最终目标是应用

文章讲的是王洪涛:大数据技术的最终目标是应用,"大数据"自诞生之日起,业界对它的概念.技术和应用就存在一定争议.究竟什么是大数据?有哪些大数据技术?大数据的未来是怎样的?每个人都有自己的理解.在2013大数据产品评选活动举办之际,笔者采访了此次担任评委的几位专家学者,看看专家眼中的"大数据"是什么样的? 王洪涛,中国保险大数据智慧应用的倡导者和实践者.博士.国家访问学者.历任某保险集团战略发展部.CRM部.某保险公司董办总经理.21年保险从业经历,领导完成了跨产寿险

数据为王的时代 大数据对消费金融的影响

伴随互联网在各行各业的应用,消费金融也越来越多进入人们的视野当中.在消费金融领域,2015年P2P"崩盘".2016年频繁曝光的"裸条"事件等新闻将其推向舆论的风口浪尖,人们对其认知褒贬不一. 大数据在消费金融口碑 我们中国人一直都是相对保守的群体,除却住房和汽车贷款之外,大家对真正意义上的消费金融服务的认知还是不多.偶尔发生的负面新闻也让普通人对消费金融产生了一些不信任.对于大多数人来说,消费金融究竟意味着什么呢? 前不久,在中国消费金融产业研讨会暨国内首份&qu

千亿数据营销战场:大数据能否灵魂附体?

营销是大数据首当其冲的战场之一,但大数据营销,是虚是实? 在大数据营销领域,最广为人知的莫过于那则笑话:由于一个经理在自己电脑上看到公司网站页面上有不雅广告,责怪底下人工作不力.而事实上,正是大数据在背后挖掘出了这位经理的网络浏览特征. 事实上,这个笑话所表达的场景,在眼下的大数据技术下并不难呈现.目前在数字营销领域,几乎所有人都在谈利用大数据精准投放. 而根据艾瑞咨询的分析预测,2013年我国数字营销市场规模达到1100亿元,同比增长46.1%,维持高速增长,预计2017年市场规模可达2862

大数据为社会征信机构带来机会 行业或迎来爆发期

随着互联网金融的快速发展,P2P 网贷.互联网保险.虚拟信用卡众筹等金融业态相继出现并逐渐成熟,产生了大量身份识别.反欺诈.信用评估等多方面征信需求.而征信行业正在迅速向个人生活的各个领域渗透. 据考拉征信首席技术官葛伟平介绍,仅该公司的就已经开始基于个人信用信息对金融.职场.民生.购物.租车.租房.交友等多领域的服务尝试.据他介绍,已有300多家机构开展了合作."如果说去年是个人征信市场的觉醒,那么今年就是崛起."他表示. 据中诚信国际预测,目前中国个人征信市场空间为1030亿元,未

周涛教授弟子王军与他的卧龙大数据

编者按 中生代技术年度大会荣幸的邀请到卧龙大数据CEO.电子科技大学大数据研究中心博士王军作为分享嘉宾. 中生代技术小编有幸对王军做了一些访谈,如果你想了解大数据风控,那么这篇采访你不能错过,想听到更多的干货,3.18的中生代年度大会就更不能错过  王总,能不能谈一下你的从业经历? 07年开始在电子科技大学读计算机科学与技术专业,本科的时候带领梦飞无线工作室做了很多商业项目.11年开始在电子科技大学硕博连读,14年开始创立卧龙大数据. 请和大家介绍下你和目前所从事的工作 ? 我来自大城市--铁岭

第八届中国云计算在京召开:云计算大数据加速发展

由中国电子学会主办的第八届中国云计算大会5月18日~20日在北京国家会议中心盛大召开.本次会议由工业和信息化部.中国科学技术协会.北京市人民政府指导,中国云计算技术与产业联盟.中国大数据专家委员会.中国电子学会云计算专家委员会承办,世界工程组织联合会创新专委会(WFEO-CEIT)作为协办单位,ZD至顶网.计世资讯.锦囊专家协办,大会主题为"技术融合,应用创新".工业和信息化部副部长怀进鹏出席会议并讲话,云计算大数据领域的9位院士和200多位专家在全体大会和专题论坛上作报告,三天共有超