大数据之父:数据过度解读就是滥用数据

文章讲的是大数据之父:数据过度解读就是滥用数据,26 日,全球第一本关于大数据的著作《大数据时代》的作者、被誉为“大数据时代的预言家”、“大数据之父”的牛津大学教授维克托·迈尔·舍恩伯格受邀做客中山大学“黄埔大讲堂”,开讲“大数据能做什么”。他表示,在解释数据的过程中要非常小心,如果解释得过度了,实际上就是滥用数据。

  舍恩伯格现任牛津大学网络学院互联网治理与监管专业教授。他说,美国航空业在营销、旅客体验等领域,仍然有大量的需求没有得到满足,这其中也就蕴含了大数据技术应用的大量机会。近年,谷歌公司购买了美国航空业的大量数据,试图通过将数据与移动整合到一起,了解客户的需求,为航空公司构建一个有用的差旅助手。其中美国政府规定,谷歌公司即使购买了数据也不能对其进行垄断,其他方也有权使用这些数据。政府应当在数据垄断的问题中担当起重要角色,以此来实现更加公平、合理地使用大数据技术。

  他警惕地分析说,在解释数据的过程中要非常小心,如果解释得过度了,实际上就是滥用数据。比如在美国做汽车分析,显示橙色车维修的成本是最低的。“大家可能在想,为什么橙色的车维修率低?是因为橙色的车夜晚看得更清楚?还是开车的人更小心?”在数据分析的过程中,“要找的是相关关系,而不是因果关系。”

  舍恩伯格总结说,人类要通过数据去进行学习,进行创新,但是也要想有时候可能数据本身跟现实是有一定距离的。所以,人类可能对于现实了解不多,还有很多要学习,要坚信大数据是最重要的。

作者: 崔月

来源:IT168

原文链接:大数据之父:数据过度解读就是滥用数据

时间: 2024-10-28 18:32:45

大数据之父:数据过度解读就是滥用数据的相关文章

被“过度解读”的大数据

据美国http://www.aliyun.com/zixun/aggregation/31646.html">媒体报道,在"大数据时代",我们生活中的一切似乎都可以通过量化的方式来进行解释,但在逐渐熟悉这个名词的同时,我们也必须要警惕"过度解读"大数据对企业可能造成的危害. 在电影<派特的幸福剧本>中,罗伯特?德尼罗饰演的角色就给我们在这方面进行了一番生动的"诠释".这个名叫老派特?索利塔诺的角色,是费城老鹰橄榄球队的

大数据之父舍恩伯格:大数据的核心要义在于共享

8月25日,2016IEBE(上海)国际电子商务博览会暨互联网+科创应用展"智享生态联接未来"高峰论坛在上海举行.大数据之父舍恩伯格出席了本次论坛,他与参会者探讨了大数据时代电子商务未来的发展趋势.他表示:"电子商务是更高效的交易,让两个交易方进行更高效的撮合.大数据给我们最核心的好处是让我们再回到买方和卖方的场景,帮助我们修正对世界的认识." 他同时还提到了大数据时代的一个问题:当数据和数据分析本身被我们进行分析的时候,有的时候,时间成本会更高.此时我们应该怎么办

大数据舆情分析:全方位解读《战狼2》

文章讲的是大数据舆情分析:全方位解读<战狼2>,作者从大数据舆情角度出发,对<战狼2>进行了全方位的解读,文章从全网舆情.微博传播.文本分析三个方面展开. 上个月,笔者去电影院看到战狼2分数这么高,9.6分,这在人人审美感官都不同,一部片子总有人喊烂电影的时代,9.6分的国产电影这是多么不容易的成绩啊;最近几天,笔者的朋友圈和微博都被<战狼2>刷了个遍,这让笔者产生了对<战狼2>进行全面大数据分析的冲动. <战狼2>是吴京执导的动作军事电影,由吴

大数据:13个真实世界情景中的数据科学应用

现在让我们看看13个在真实世界情景下的例子,了解现代数据科学家可以帮助我们做些什么.这些例子将有助于你学习如何专注于一个问题和如何形式化一个问题,以及如何仔细评估所有潜在问题--总之,是学习数据科学家在提出解决方案之前,如何定位问题和进行战略性思考.你也会看到为什么一些广泛使用的技术,如标准回归,可能并不适合所有情况. 数据科学家的思维方式不同于工程师.运筹学专业人士.计算机科学家.虽然运筹学涉及很多分析,但这一领域的焦点是具体业务优化层面,如库存管理和质量控制.运筹学涉及国防.经济.工程.军事

人民网访谈解读一季度经济数据

本报北京4月15日电 15日九三学社中央副主席.全国人大财经委副主任贺铿做客人民网强国论坛,与 网友进行在线交流,解读一季度经济数据. 贺铿在访谈中表示,今年通货膨胀的压力比去年要大,但是只要措施得当,今年控制在5%以内,应该说是没有多大的问题的.现在首先要防止物价过快上涨,同时要使经济有个适当的发展速度.如果经济发展速度过低,就业岗位就会少,失业率会增加,一般的低收入者如果连合适的工作都找不到,那生活就更加困难了.更多内容请浏览人民网人民访谈.

mysql-复制一列数据到另一个表,还要在数据前面加字符串,求大神给思路!

问题描述 复制一列数据到另一个表,还要在数据前面加字符串,求大神给思路! 比如查询A表产品id,复制到B表并且统一加入 product_id,最后的效果是 product_id=1 product_id=2 有没有sql语句能做到? 解决方案 SQLServer某个表的数据批量导入到另一个表复制一个库中的表数据到另一个库表中 解决方案二: 创建B表,两个字段( product_id ,设置成主键 自增长,从1开始.),id (来自A表) insert into B(id) select id f

Wireshark抓包工具--TCP数据包seq ack等解读

1.Wireshark的数据包详情窗口,如果是用中括号[]括起来的,表示注释,在数据包中不占字节 2.在二进制窗口中,如"DD 3D",表示两个字节,一个字节8位 3.TCP数据包中,seq表示这个包的序号,注意,这个序号不是按1递增的,而是按tcp包内数据字节长度加上,如包内数据是21字节,而当前IP1发到IP2的包的seq是10的话,那下个IP1发到IP2的包的seq就是10+21=31 4.注意我们分析tcp包时,要以一个会话做为一个完整对象,即通讯只发生在两个IP之间,两个固定

求大神帮忙 MySQL 去掉数据库中重复的数据,保留一条

问题描述 求大神帮忙 MySQL 去掉数据库中重复的数据,保留一条 解决方案 mysql中删除两条重复的数据,只保留一条mysql 删除重复数据只保留一条mysql删除重复数据只保留一条 解决方案二: 菜鸟的答复: ** 删除前先备份一下,万一错了,我不管 ** /* 假设你的表叫table_car */ DELETE FROM table_car WHERE car_id NOT IN (SELECT MIN(car_id) FROM table_car GROUP BY car_line_i

【数据蒋堂】第5期:1T数据到底有多大?

一英里不是个很长的距离,一立方英里相对于地球也不会让人觉得是个很大的空间.然后我说,这个空间内能装下全世界所有人,你会不会觉到很惊讶?不过这话不是我说的,是美国作家房龙在一本书里写的. 业内有个著名的数据仓库产品,叫Teradata,20多年前起这个名字,显然是想给人能处理海量数据的感觉.可现在,论用户还是厂商,谈论数据量时都常常以T为单位了,动不动就有几十上百T甚至PB级的数据.似乎T不是个多大的数,多几个几十个T也没什么大不了的. 其实T有点像上面说的立方英里,是个挺大的数.很多人对它没有多