大数据如何有序地“变废为宝”

近年来,数字经济已成为带动经济社会发展的重要动力。无论是利用数据赚钱也好,还是希望做“高大上”的公共服务、社会治理改善也罢,大家都面临一个法律上的问题:如何保护数据?数据的权益归谁所有?本文提出5个观点,供各方思考和讨论。

第一、大数据需要处理

在大数据时代,任何数据均具有潜在的价值。过去,人们重复利用的数据资源主要是人类观察、思考、创作完成的成果,如文章、文件、论文、著作等。如今,人类可以利用各种机器运行轨迹、人类活动记录、自然界变化观测等信息。过去需要大量观察访谈、调查统计、测量等完成的东西,现在可以借助计算机系统、各种数据采集器快速完成,并通过大数据分析工具实现全样本、自动化处理和分析。过去,没有人在意自己的行为轨迹,也无法记录大量的事件和过程,它们可以说作为“垃圾”被自觉或不自觉地扔掉了。现在,数据技术使人类具有“变废为宝”的能力,大数据技术可以在浩瀚的数据海洋中淘到“宝贝”。

因此,数据正在成为人类可拥有和控制的资源。大数据正在提供新的研究范式,帮助世人重新认识宇宙、物质、生命和社会,并在此基础上带来科技技术、管理决策、社会发展的巨大变革。就此而言,数据利用秩序有望成为未来社会的一大基础秩序。

第二、传统的财产权体系并不适合

如果说所有权(排他支配权)是构筑物质资源利用秩序的法律工具,那它是否可以移植到数据世界并用来建构数据的利用秩序呢?答案是否定的。所有权是对特定物的排他利用权利体系,而数据的非物质性导致其很难实现排他使用。因此,数据天然地不适合于所有权体系。

第三、在保持数据产品开放性和权益保护上维系平衡

数据从原生数据到有价值的数据产品需要投入,这不仅仅是劳动投入,而且还包括资本投入。只有当这些投入得到足够的回报时,才有人愿意从事数据的收集、处理和加工,将数据转化为产品或服务。这里面,解决数据产品制作者的激励问题,是数据赋权要解决的核心问题。

一般认为,即便是数据产品,也要保持社会公众对该产品的可接触或可学习的公共属性。由此,数据产品的制作者权利应当包括自己使用和许可他人使用的权利,或者利用数据提供服务的权利,同时有权制止他人出于商业目的而使用相关数据产品的权利。

这种基于对于数据分析加工劳动而取得的数据使用,属于一种新类型财产权,可以称之为数据使用权。区别于传统物权的是,它不是对数据的支配权;区别于传统知识产权的是,它并不要求独创性或创新性。这样,就可以给数据产品制作者实现其收集和加工数据的激励,促进数据产品的生产和流通,满足社会对数据产品的需要。

第四、数据来源方的利益要有保护

在大数据环境下,一切数据皆有源。当数据来源于个人或者是对个人的描述时,就进入了个人数据(个人信息)范畴。隐私保护是个人数据保护的重要组成部分。在这方面,国际社会关于个人数据使用的总体原则是合法、正当和必要原则,以不侵犯个人尊严或自由等基本权益,尤其是隐私利益为基本限制。同时,个人信息的收集和使用必须尊重个人权利,必须确保个人可干预(更正、删除等)。

除了来源于个人外,企业数据还需要获得其他企业和社会组织的数据。除非这些数据是处于可供他人自由获取的公开状态,否则取得这些数据就需要获得数据实际控制人的同意,而不能够随意抓取、窃取或采取其他非法手段获得。

大数据应用最关键的是取得尽可能大而全的数据,但这一过程必须合法合规,其中最为重要的是尊重和保护个人信息权益。由此,数据利用秩序归根结底是要建立数据来源方(原材料提供者)到收集加工制作方(制作者)再到数据使用方(消费者)有关于数据权利和义务配置秩序。在保护各方权益的前提下,尽量保持数据开放性和流通性,使数据得到社会化的利用,实现数据的真正价值。

第五、数据分享和利用要有激励

在数据可控制的情形下,要让人们把掌握的数据拿出来分享和利用就需有激励,必须创制数据社会化利用的良性机制和秩序。由于数据本身需要保持一定公共性,赋予任何主体对数据和数据产品的绝对支配权都背离发展理念,因而数据赋权需要坚持信息自由流动。

总之,数据总是处于不断脱离原来主体而流动的过程中。正是因为这样的流动,数据才能产生更多的价值。但与此同时,脱离主体也意味着原主体丧失对数据的控制。因此,既保持数据的自由流动性,又维护每个主体在数据上的利益,是一个有待深入思考的法律难题。一个基本的原则可以明确:创制和维护数据利用秩序是大数据应用的前提,是大数据战略得以实施的根本问题。 

原文发布时间为:2017-10-19 

本文作者:高富平

时间: 2024-11-28 19:15:36

大数据如何有序地“变废为宝”的相关文章

尽快启动大数据立法

"大数据被誉为'21世纪的石油',是比设备更宝贵的财富,是国家基础性战略资源,是未来核心竞争力.但如何界定.保护这类虚拟财产及其衍生产品,我国还缺少与之相对应的数据法.数据隐私法等."10日,全国人大代表.华中科技大学计算机学院院长.武汉光电国家实验室信息储存与光显示功能实验室主任冯丹建议,考虑到大数据对公众利益.公共安全的重要性,亟须尽快启动数据立法. 冯丹说,目前,世界各国已经围绕数据立法,通过法律法规建设保障数据主权."十三五"规划纲要草案提出,我国未来五年要

2017大数据标准化论坛发布了第一批大数据系统测试结果,阿里云数加获得了大数据系统测试证书。

2017年3月18日, 2017大数据标准化论坛在北京成功召开.本次论坛由工业和信息化部信息化和软件服务业司和国家标准化管理委员会工业标准二部指导,中国电子技术标准化研究院和全国信标委大数据标准工作组共同主办.全国信标委大数据标准工作组组长梅宏院士.工信部信软司李冠宇副司长.国家标准化管理委员会工业二部刘大山副处长.大数据标准工作组高林秘书长.工信部信软司孙文龙处长,贵州.上海.四川.宁夏等产业主管部门领导,以及全国范围内的产.学.研.用300余位代表参加了会议,围绕大数据标准化工作.大数据技术

慢动作,也许才能继续大数据的颠覆之路

更多的时候,无价值.重复性的数据经常会形成类似于信息噪点式的"数据垃圾场",而有价值的信息却总是被屏蔽在入口之外. 数据的价值不产生于无用的信息爆炸,而是通过慢数据,可以预测个性化信息的数据. 目前,大数据的火一度使其被外捧上云端,慢数据的思路或许给外界带来不小的疑虑:在大数据的概念火完之后,如何让大数据先流动起来才具有普及意义.这座"金矿"的挖掘注定是一场革命性颠覆,而颠覆永远会是个慢动作. 那么,末端对于入口的反哺究竟有多大? 大数据的普世意义究竟在哪里?预测.

大数据的“隐私”边界在哪儿

大数据的"隐私"边界不在该不该发现和汇集一些必要的信息,而在于后续,这些信息如何被保存.管理.分析和使用.信息可以被搜集,不代表信息可以被滥用.笔者认为有三重边界需要坚守,也应该是任何大数据运营管理方应该恪守的底线. 当我们生活在一个智能设备满天飞.网络信息无处不在的时代,我们就必须面对一个有趣而又细思恐疾的现实,就是越来越多的我们的行为.轨迹.信息甚至未来可能是那些深入我们脑海中的一些想法,都可能随时被感知.被发现.被搜集.被分析.被应用--好像我们越来越从一个被包裹着的私密环境中被

李彦宏的启迪:大数据从火到活是个慢动作

泡泡网资讯频道5月30日 "有价值的数据,不是无用的信息爆炸,而是有价值的慢数据,可以预测个性化信息的数据."这或许是2014年百度联盟峰会李彦宏发出的最掷地有声的大数据言论,当然,还有他提及的新企业级软件建言. 在此之前,大数据的火让外界一度将其捧上了云端,李彦宏的思路或许给外界仰视的目光至俯视的疑虑:在大数据的概念火完之后,如何让大数据先流动起来才具有普世意义.这座"金矿"的挖掘注定是一场革命性颠覆,而颠覆永远会是个慢动作. 末端对于入口的反哺究竟有多大? 大数

ENCODE变废为宝 大数据成就基因工程

1972年,日本遗传学家大野乾给不能编码蛋白质的DNA片段起名为"垃圾DNA".然而在2012年9月5日的这篇"80%的基因组是有功能"的报道中说明,这些大野乾称为"垃圾"的DNA实际上是一个庞大的控制面板,能调控数以万计基因的活性,并决定了一些基因的特质.如果没有这些开关的调控,基因将不能正常工作,而这些区域也许会导致人类患上疾病.这个发现震惊了整个科学界! 但是对于计算机领域的我们来说,神奇的不仅是ENCODE项目的成果,还有那些提供支持的基

大数据工程师练成记之首重:知识体系一览!

我们想要告诉大家的是成为大数据工程师需要掌握的知识体系,而作为初学者,你可以先从简单的入手,慢慢在学更深的知识,拿出高考的恒心和坚持来,肯定能行. 值得一提的是,目前大数据工程师的月薪都是20K起,月收入两万的薪资是不是很诱人?而且大数据工程师是非常容易找到工作的,所以--Why not 不扯犊子了,由于篇幅所限,这一部分内容主要包括数据可视化.机器学习和算法三个分支. 数据可视化 R R不仅是编程语言,同时也R具有强大的统计计算功能和便捷的数据可视化系统.在此,推荐大家看一本书,这本书叫做<R

蒋步星:轻量级大数据计算引擎

近几年,大数据非常热门,大数据计算的方案也较多,目前,大数据计算机平台有很多,但却越来越沉重,主要是由于这三个方面的原因: 并不是任何事物都需要沉重的大数据平台,许多还是需要轻量级计算. 轻量级计算需求 大数据的技术本质是高性能 提高性能的需求无处不在 不总是有那么大的数据量 低延迟即时响应业务数据量并不 不总是适合部署大数据平台 即时查询常常有被集成需求 临时性数据处理来不及建 设 大数据平台 不总是可以扩容硬件(内存) 大数据开发难度大 大数据平台对SQL查询关注过多 性能比拼的主要阵地 优

阿里巴巴大数据实践之数据建模

随着DT时代互联网.智能设备及其他信息技术的发展,数据爆发式增长,如何将这些数据进行有序.有结构地分类组织和存储是我们面临的一个挑战. 为什么需要数据建模 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置:如果把数据看作城市的建筑,我们希望城市规划布局合理:如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措. 数据模型就是数据组织和存储方法,它强调从业务.数据存取和使用角度合理存储数据.Linux的创始