清华数据院院长韩亦舜:大数据时代的数据伦理问题探究

导读:5月26日,2015年贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会在贵阳召开,数据开放与隐私保护作为一个专门的分论坛,在同天下午举办。清华大学数据科学研究院执行副院长在会上做了大数据伦理与道德的分享。大数据文摘今日带您走进数据开放与隐私保护论坛,聆听韩亦舜院长对数据引发伦理道德问题的看法。


韩亦舜

清华大学数据科学研究院执行副院长,关注数据开放,数据伦理以及数据隐私研究

以下是演讲实录

刚才几位嘉宾就数据的安全问题,隐私问题分享了观点,我今天从不同的角度说一些有待探讨的观点。

我不知道大家是否听说过,曾经在国外伦理课上有一个经典的故事,说的是一个轨道车按照正常轨道向前行驶,但是突然刹车失灵,前面轨道上有5个人。司机还有一个选择,选择旁边一条道,旁边的轨道上有1个人。那5个人违规了,1个人没有违规,如果撞死这1个人,显然这个人是无辜的,但是一般认为撞死1个人的代价小。这就遇到了伦理的困境。今天大数据时代,我们会面对同样的问题。我们把情景改为是一部谷歌的自动驾驶车,想一下自动车遇到这种情况会怎么样,也许他可能比当年那个有轨车司机做决断的时候想得更多算的更多,能发现这1个人跟5个人的身价,有没有犯罪记录,到底撞谁合适。其实我们面临的很多东西数据是算不出来的。

这是一类伦理问题。还有在数据伦理上遇到另一个挑战,会不会产生大数据时代的弃儿。今天我们都是用手机打车了,我们的父母,那些不会用智能手机的人,出门还打得到车吗?我是今年才开始用手机打车的,之前每次打不到车的时候我都恨自己为什么不学会启用手机打车软件。我还算是信息时代的赶潮人,但是我们的父母怎么办呢,他们很有可能将来与这个数据时代差距拉得越来越大,很多人会成为信息时代的弃儿。该怎么办?还有,如果你曾经有过犯罪记录,将来走到哪里都会被查到有案底而受到歧视怎么办?怎样才能正常地回归社会?

接下来,我们讲去年最后一天发生的那个不该发生的事情,上海发生踩踏事件死了很多人,也有很多官员受处分。最让人遗憾的是之后网上发了很多报告说这个事情可以避免。在座的搞技术的人都知道,我们用手机定位是可以看到人流的变化趋势,就可以采取应急措施。可惜这些技术在我们该用的时候都没有用上,这个背后什么问题呢?

我们讲信息孤岛,还有一个责任孤立的问题。拥有公共安全移动数据的机构,并不需要对公共安全事件负责。如果给处分的时候把拥有公共安全数据的人也包括进来,可能他们就不会有不同的思考。我们都说安全大事,信息安全是头等大事,它也变成谁都不愿意碰的话题。2014年年初就发生了一个踩踏事件,只是在稍微偏远的地方,大家传播得不太广就没有引起重视。现在上海的外滩还会不会再发生?除了公安部门规定多少人不能组织群众集会,要申办单位自己有保护措施等,是不是涉及公共安全的数据仍然没有开放没有利用。所以我就问一句,数据安全或者保护数据就一定对吗,这里也有一个伦理问题,你拿的是社会公共安全的数据你不用起来,最后造成社会公共安全事故,你觉得这对吗?

第三个例子是"人肉"。我不知道各位有没有参与过"人肉",我这里提一个最新的"人肉"案例,发生在成都那个女孩子超车被打的事情。我不知道在座的有没有参与或传播这个事,批评这个女孩子赞那个男孩子?我觉得有一个事不对,就算她再怎么不对,那个男孩子都不应该下车打人。大家后来收到过进一步的信息吗,女孩子开房的信息都在网上传,太可怕了,这就是网络暴力。今天互联网的传播力太强,甚至会导致出现网络暴力。有时候大家可能觉得我们用“人肉”方式把抽烟的官员,带表的官员挖出来,大家感觉大快人心,但我们要清楚“人肉”不是公器,不能作为一个普遍的工具。如果我们任由这种思想发展、这种形式存在,对社会是有危害的。今天就算这个女的超别人车不对,中间双方又互相别车什么的,我们就该站道德的高度上践踏别人的权利吗?把别人女孩子开多少次房都发到网上?中国原来就有一句古话好事不出门,坏事传千里。政府干部们苦于做了好事传不出去,有一点坏事马上传开。当有一些不负责任的言论遇到社会心理扭曲的时候,网络的危害就很容易被扩大。记得几年前就有网络暴力歪曲事实,最后害了男女恋爱双方其中一方跳楼这种悲剧。也许男女双方跟传播网络言论的人没有什么关系,因为这种舆论压力把别人害死了,而且跟事实还不符。这很可怕。

刚才讲的这几个例子说明大数据时代,出现了一些新关系新问题。过去就有伦理道德一说,大数据时代有了数据伦理道德。大家想一想大数据时代的到来,可以让在遥不可及的地方,如果没有互联网,没有交通工具,没有通讯工具就根本不会认识的人,不会跟他发生一点关系的人联系在一起。像这样的人与人组合是大数据时代才有的新关系。互联网时代完全没有关系的人也会伤害到其他人。传到我手上说那个开房记录跟成都那个女的没有什么关系,但是这个传播伤害了别人。这个大数据时代产生特殊的人与人之间的关系,是数据关系。

我们通常讲道德,伦理,也没有什么严格定义,我们就这么认为吧。核心部分是法律规定,法律以外就是在道德伦理范畴,我把道德跟伦理稍微区分了一下,道德广义一些,伦理就是人跟人具体发生关系了。你在街上扔一个东西,开车的时候扔一个垃圾别人说这个人不道德,不会说这个人不伦理。如果你侵犯别人隐私不光是不道德,还是伦理的问题。


我们提倡一个观点,就是要建立在大数据时代的伦理原则,挖掘数据的时候问问你自己到底要干嘛;有的是生成数据,生成数据的时候要对你生成的数据负责。能不能提倡一个传责自负?记得我在大学读书的时候,也发生过现代陈世美跟秦香莲那样的事情,当时是贴大字报,那个也是传播信息,只是没有现在这么快,伤害也就小一些。今天你传播了就要对你传播的内容负责。当然我们需要考虑对公众人物,对普通人物,对公众行为和对个人行为的区别对待。公众人物有时候很希望别人关注他,他想着法把一些信息甚至对一般人来说是隐私的信息暴露出来。这时你传播一个公众人物信息的责任和你传播一个素不相识人信息的责任会不一样。我们要探讨数据时代人与人之间的关系怎么确定?最后一个伦理原则即便抛开大数据时代也是对的,那就是我们的古训:“己所不欲勿施于人”。

再讲讲利己主义的悖论。隐私问题:我们现在一方面希望得到个性化服务,一方面希望保护自己的隐私。当女生定制一件合体的裙子时候,你已经把三围告诉别人,而且让别人寄到你家里。为什么你告诉别人,你不图的就是个性化,这是一个悖论。不要过分强调个人隐私。如果你想要隐私,不许医生使用你的病例在别人身上,医生可以不给你治病。因为医生治病能力是在大量别人病例的基础上建立起来的。第二个悖论服务。是我们家的例子,就是住的地方信号不好,投诉几次移动公司说你们小区的人都不同意建基站,我们一方面希望有很好的通话质量,又不想自己住的周边放基站,这都是伦理的思考。当然还有一方面希望别人把数据公开出来,一方面找种种借口不开放自己的数据。

这里面涉及很多新时代的问题,新的挑战,但我认为我们价值观会重塑。什么是隐私?有些在今后不再成为隐私,你走在公众场合下,你就没有了行为方面的隐私。我今天讲的每句话都得负责任,所以我说的话都不是隐私。数据的权属问题,我们刚才专家提到,有没有权把自己信息删掉,如果有一个犯罪分子对你进行了侵害,我们到网上查它的踪迹的时候,结果说对不起,他10分钟之前把自己的信息删了,作为受害者你愿意吗,肯定不愿意,很多事情是双刃剑。信息安全问题也是,没有绝对的安全,我们一环一环扣起来,争取能够发现问题解决问题。现代社会权力和义务是对等的,没有对数据的绝对权力,个人没有,企业没有,政府也没有。

今天铺天盖地的数据向我们袭来,我们有很多新问题还没有解决好,包括数据道德伦理教育。法律永远不可能解决所有的问题,我们需要道德伦理,要进行伦理道德教育。希望伦理道德教育能够作为基础教育一部分,包含数据时代人与人之间关系的新特点;面对利益冲突的时候,运用大数据理念分析各方的关注点以达到新的平衡。在道德伦理教育中要有正确的舆论引导,要建立基于数据伦理道德的新公序良俗。

大数据给我们出了这么多难题,我个人还是很看好大数据。因为毕竟这个大数据让我们把这个社会、这个世界和我们自己看得更清楚了;大数据因为它增加了信息透明度,有利于建立社会的公平正义。大数据时时在提醒我们行为规范,大家既然觉得自己害怕一些做的“坏事”暴露出去,那就少做或者不做。我在清华的时候听学生们说在中国人民银行的网站上可以查自己的信用记录,我能够隐约感觉到学生们在意自己的信用记录了。有越来越多的人在意自己的信用记录,对于我们中国这样一个没有很好的建立起信用体系的社会来说,是一个好事。说明大家开始有这个意识了。


另外毕竟跟过去相比大数据让我们更接近事实,一个人的DNA数据有几个T,这个是不是跟十万年前一样不敢说,但是这个数据可能一万年前就是存在的,只不过那时我们不知道。我们今天突然知道这些数据的存在感觉挺恐怖的。但是大家想一想,在16世纪到17世纪的时候,人类刚刚发明望远镜,我们突然发现某一亮点原来是一个大星球;我们肉眼看手上什么都没有,拿显微镜一看,看到很多细菌在那里走感觉很恐怖。我们今天发现很多我们不曾接触的数据,感觉一下子乱了章法。人类就是在不断的认识世界中前行。我们今天对世界认知的颗粒度超过以往,我们要看清这个世界。大数据还能够记录违背法律及公序良俗的行为,帮助我们建立更好的秩序。大家都希望这个社会变得更美好,大数据能够帮助我们让这个社会更美好。

今天提出这些问题,还是希望引起大家的思考,能够带来大家对大数据的兴趣以及大数据相关问题的深入讨论!谢谢大家!

原文发布时间为:2015-05-28

时间: 2024-07-28 22:24:22

清华数据院院长韩亦舜:大数据时代的数据伦理问题探究的相关文章

韩亦舜:谁能熟练运用大数据思维,就有机会成为下一个马云

在大数据时代,没有人能游离于大数据之外.为更好的融入这个时代,我们能做的就是学会并熟练的掌握和运用一种全新的思维方式--大数据思维.大数据可以是名词.是动词.是形容词--正如许多流行语一样,"大数据"是一个含糊不明确的词语,经常被人们信手拈来又随手抛去.从2012年至今,经过铺垫.酝酿.炒作.质疑,"大数据"渐渐走下神坛,轮廓更加清晰.界限更加明确. 近日,中国大数据产业观察网记者在清华园内专访了清华大学数据科学研究院执行副院长韩亦舜,探究大数据的"真实身

清华韩亦舜:大数据革命与新经济分析

◆ ◆ ◆ 导读:本讲座为清华大学数据科学研究院执行副院长韩亦舜于2016年7月14日在首届中国大数据应用大会上所做的题为<大数据革命与新经济分析>的演讲. ◆ ◆ ◆ 我们研究经济的时候,一定会放眼世界看更大的版图,因为今天的中国已经是世界第二大经济体了.看这张图的时候大家想一想,如果没有互联网,我们不可能及时地看到这个世界.80年代,电话开始进入了普通中国家庭.但是数量还是很少,通讯基本还是靠书信.现在信息发展非常快,这就要求我们思考:当我们放眼世界的时候,以什么样的思想和工具观察这个世界

韩亦舜:客户数据隐私问题初探(附PPT)

 韩亦舜:大家上午好.老实讲,看了一下演讲嘉宾的构成和他们要讲的题目,把我放在第一个讲还真有点儿压力,因为隐私这个问题在中国有些模糊,我第一个讲可能让大家的思想受到束缚.当然,可能也说明咱们联盟对数据隐私问题比较重视.我就借此机会分享一下我们的思考. 隐私是一个让大家比较纠结的话题,大数据时代的客户是什么样?隐私又有什么样的内涵?在座的做客户管理的人很多,我们就先从客户与商家的关系说起.中国有很多的话都把客户关系描述的很感人,有人说:客户是上帝;有人说:客户是衣食父母.其实本质上,客户和商家就是

回顾2016年大数据的发展,盘点十大最热门的数据岗位

随着很多大公司对数据分析需求增多,数据相关岗位的人才需求量也越来越大.数据学作为一门学科,已经受到时代的追捧.数据学,或者更准确来说,大数据,在2000年早期还是个冷门,而现在早已成为人们关注的焦点.早在2014年,高德纳咨询公司就预测,到2016年将有73%的公司企业将在大数据项目中投入重金. 2016年的尾声即将到来,我们是时候回顾一下大数据的发展,盘点十大最热门的数据岗位. TOP1 首席数据官(CDO) 三军不可无帅也,所有想在大数据项目中取得成功的公司都需要首席数据官坐镇指挥.2014

韩亦舜:大数据、大挑战、大责任

我们先来看看大数据与大挑战. 在座的有谁11.11的时候参加过"剁手党",买过东西?双十一让我们爱恨交加.我们来看这两张图,一张是春运,一张是十一黄金周. 黄金周和春运带来的问题大家都有了解. 再来看看这张图. 为什么这个时候拿出这样一张图来看?一个是时尚的网上采购,一个是那么拥堵的线下行为,有联系吗?有!我们应该想一想,这两个线上线下看似无关的事件,背后是资源的不均衡利用和商户的不当得利.春运的时候大家都希望用最短的时间回到家,但是最后导致社会资源的不均衡.十一黄金周集中出行有这个问

究竟什么是大数据,如果它不是关于大,也不需要考虑数据?

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   很多人问,为什么没有鉴于庞大的媒体接收出现关于大数据的公认的定义.鉴于瞄准这一行列(与创业投资的创业)全球IT厂商在营销上所花费的努力,他们对此产生疑惑也是可以原谅的. 就像大部分的消费者营销好奇地的重点是青少年买家的购买力只是他们的父母和祖父母的一小部分,大数据和它的推动者也是一样. 他们用流行语向他们的传统客户--IT部门展示,而未能参与(事实上,完全疏远)

读懂这篇文章就懂大数据,3000字概括《大数据时代》

有言在先 近期有些起伏,这种情况最适合回归书本,寻找一些你内心认同的东西.这几天花了点时间重温<大数据时代>,整理.总结出了精华的东西,分享给大家. 大数据引起了变革 当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见. 1.震人心魄的数据 2003年,人类第一次破译人体基因密码的时候,辛苦工作10年才完成了三十亿对碱基对的排序;大约10年后,世界范围内的基因仪每15分钟就可以完成同样的工作.在金融领域,美国股市每天的成交量高达7

Tableau预测:自助式大数据分析时代正在来临

对于大数据而言,2016年是具有里程碑意义的一年,更多企业和机构在该年度存储和处理各种形态和规模的数据,并从中提取有价值的信息. 站在辞旧迎新的2017年伊始,Tableau预测随着数据管控和保护系统以及大数据分析系统的日趋成熟,人们将要迎来自助式大数据分析时代. Hadoop的发展为自助式分析奠定技术基础:速度更快.门槛更低,安全标准更高 作为一款大数据开发和运行处理的软件平台,Hadoop最初来源于谷歌的MapReduce编程模型包.该模型包可以把一个应用程序分解为许多并行计算指令,并实现跨

优易数据研究院院长车品觉:如何形成大数据生态链的闭环

5月26日,优易数据研究院院长车品觉在数博会"大数据创新生态体系论坛"上发表<如何形成大数据生态链的闭环>的主题演讲. 生态一词,是个复杂的系统;由于系统复杂,就需要协同分工.车品觉指出,谈到大数据,就会想到大数据科学家,但如果想把这件事做好,需要做数据工程的人.做数据算法的人和产品经理的共同努力. 另一个与生态有关的,是将大量的数据转化为企业的行动力.企业走向全面数据化,可以遵循以下步骤:一是关注决策的过程,加强数据分析能力;二是建立数据资源,整理数据标准;三是形成管理规