历时两年的微博与脉脉数据之争落幕,互联网公司请看好你家的爬虫!

历时两年的微博与脉脉之争终于有了结果:法院认定脉脉非法抓取、使用微博用户信息行为构成不正当竞争,一审判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。两年前我有关注到微博与脉脉的数据之争,这在口水战每天都发生的互联网圈本来不算什么大事。但这次法院判决结果,还是挺出人意料的。毫不夸张地说,这一事件给互联网公司敲响了关于用户数据保护的警钟。

一个常规的数据抓取纠纷

先简单说一下微博和脉脉之争的来龙去脉。

2014年8月公开闹掰:微博宣布停止脉脉使用的微博开放平台所有接口,理由是“脉脉通过恶意抓取行为获得并使用了未经微博用户授权的档案数据,违反微博开放平台的开发者协议”。与此同时,脉脉宣布终止支持微博登录,并通过一些邮件截图曝光微博此举,是因其投资脉脉不成,索要脉脉用户关系数据受阻后的报复。就像所有口水战一样,双方各执一词、真相扑朔迷离。

2015年3月对簿公堂:微博主体公司于2015年3月将脉脉主体公司告上法庭,微博脉脉之争升级。

微博起诉理由主要有脉脉非法获取和使用微博信息,商业诋毁等。

在用户微博登录脉脉并上传个人通讯录之后,大量非脉脉用户的微博头条、昵称、职业、教育等信息出现在脉脉上,这些信息并不在微博OPEN API之中,并且在微博停止脉脉所有接口权限之后,脉脉依然进行了相关数据抓取,微博认为脉脉通过非法手段获取信息。除此之外,微博认为在双方“闹掰”之后脉脉发表的公开言论对微博商誉构成了诋毁,脉脉采取了类似于微博加V认证的机制和界面设计,构成不正当竞争。

法院认定,脉脉绕过OPEN API抓取数据的行为,危害到微博用户信息安全,损害了微博合法竞争利益,对其构成不正当竞争,商业诋毁成立,判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。

类似诉讼在互联网行业屡见不鲜。

2013年,百度因奇虎360违背Robots协议抓取复制百科等内容构成不正当竞争,起诉后者并索赔1亿元。

2016年2月,因认为百度视频通过抓取播放窗口的方式,嵌套乐视网视频资源到百度视频客户端,屏蔽了乐视网网页、网址、广告,造成公众混淆,构成不正当竞争,乐视起诉百度并索赔100万元。

2016年4月,大众点评诉百度旗下的百度地图及百度知道大量复制其用户点评等信息,构成不正当竞争,提出9000万元索赔要求。

这些案例均是某平台因内容被抓取起诉抓取方,在数据为核心资产之一的互联网产业,“数据纠纷”只会越来越多。

平台用户数据受法律保护

从法院一审的判决逻辑来看,是否保护用户信息已成数据纠纷中的法律准绳。

海淀法院在“世界知识产权日”公开宣判这一案件,或许不是巧合。其明确表示,“大数据时代,保护用户信息是衡量经营者行为正当性的重要依据,也是反不正当竞争法意义上尊重消费者权益的重要内容。”这表明,用户权益被摆在最优先位置。

在“人肉”这类网络暴力频发、用户资料屡屡泄露的大环境下,这一判决具有示范意义。平台在业务设计上必须充分考虑用户信息保护,确保用户信息不被滥用,隐私数据不遭泄露,同时确保用户对个人信息的使用有知情权。

在保护用户利益之后,才是平台利益。

值得注意的是,用户信息与用户数据并不是一回事,比如你在微信公众账号发的文章,算是用户数据,但你个人微信昵称、头像这些资料,才算是用户信息。但究竟哪些属于用户隐私则很难说,你上传到平台的照片肯定是隐私数据,但你发的公开微博就不一定了。那么,不具备“个人隐私”属性的数据是否受法律保护呢?如果有人绕过接口,抓取用户发的微博而不是个人信息,会有不同的结果吗?

这里有一个案例:百度起诉360违反Robots协议抓取知道、百科等数据的纠纷就是这样的情况,法院尊重Robots协议和平台对UGC数据的权益,360被判赔偿百度70万元。就是说,UGC内容的创建者是谁并不重要,搭建平台网站投入运营、技术和人力成本,拥有对数据的使用权和分发权。如果第三方网站违背意愿进行抓取,就可能被判为不正当竞争。

数据是互联网公司的核心资产,不论是个人信息还是UGC数据(微博、文章、点评等),所有这些平台数据都将受到法律保护,平台对这些数据拥有所有权、使用权和分发权。

互联网公司应提防数据纠纷

互联网公司想要利用别家平台的数据时,必须遵循对方的公共API协议,或Robots爬虫协议,抑或通过正式协议合作。数据受法律保护。互联网公司不能违背某平台意愿抓取其数据——在技术上或许并不难,可通过爬虫等手段绕过限制,实现数据抓取,但这样做很可能会吃官司,并且败诉几率相当高。

因为数据抓取纠纷而对簿公堂的案例还不算多,但数据抓取行为在互联网行业却很常见,比如许多平台都能看到豆瓣电影评分数据,再比如一些导购网站聚合了电商平台的评论,还有平台将微信公众账号所有文章都聚集起来…这些行为理论上来说都有数据纠纷的风险,如果你做得不够大平台一般也没这个精力理你,但万一你某天做到了呢?况且,很多大公司也这样干。

对于数据的获取和使用,不再是一个技术问题、商业问题、道德问题,而是一个法律问题,所以,请看好你家的爬虫。

时间: 2024-07-28 13:18:56

历时两年的微博与脉脉数据之争落幕,互联网公司请看好你家的爬虫!的相关文章

微博与脉脉间的用户数据争夺,用户隐私被赤裸裸的无视了

中介交易 SEO诊断 淘宝客 云主机 技术大厅 无论是脉脉还是微博,在公开的表态中都将用户隐私视为不容侵犯的权利,实际上双方均是嘴上一套背后一套,脉脉侵犯用户隐私在先,微博随后为脉脉继续侵犯用户隐私开出了条件,最后脉脉恶人先告状. 刚刚宣布获得2000万美元融资的职场社交软件脉脉与微博闹掰了,原因是脉脉涉嫌在未经用户授权的情况下恶意获取微博用户资料和职场信息,当然,这是微博方面的说辞.而脉脉一方则认为,微博的封杀令表面上看是保护用户隐私的正义之举,实际上是在多次表达投资意向遭拒之后的"图穷匕见&

派代电商年会在北京拉开帷幕,本次会议历时两天

派代电商年会在北京拉开帷幕,本次会议历时两天,分为主论坛和分论坛,本届年会主题字为"破",即"破困.破晓.破立",旨在为大家打破困境,打破传统电商思维局限,树立新的思想.致力于为创新电商行业搭建平台,从专业角度为电商同仁解决创业过程中遇到的最实际的问题. 本文是8月28日移动专场的嘉宾演讲干货精选. 源码资本合伙人曹毅:O2O也是一个电商领域,这个领域,跟传统的电商有点不太一样,O2O产品是一个服务型产品,不是实物型产品,需要线下去完成交易,消费好这个产品,从交易方

new-参数为两个数组的批量插入数据 该怎么写

问题描述 参数为两个数组的批量插入数据 该怎么写 //js var productcode = shuzu.join(","); var covertypecode = typeshuzu.join(","); /*console.log(productcode); console.log(covertypecode); */ $.ajax({ type:"post", url:"product/addproType.do",

httpclient...-HttpClient登录新浪微博,然后从微博抓取数据,下次登录的时候从cookies获取登录数据

问题描述 HttpClient登录新浪微博,然后从微博抓取数据,下次登录的时候从cookies获取登录数据 如题 小的刚入职场,领导让实现这样的功能,求各位大大指导一下 解决方案 先用浏览器登录,勾选记住密码,同时用fiddler抓包 HttpClient照着模拟,特别注意提交的cookie 解决方案二: http://blog.sina.com.cn/s/blog_75a4f95a0101ebs1.html 解决方案三: http://abandontofree.blog.sohu.com/2

求大咖指点-两块stc12c5a60s2单片机通过两块蓝牙模块HC05进行数据接受,是怎么编程实现的呢?

问题描述 两块stc12c5a60s2单片机通过两块蓝牙模块HC05进行数据接受,是怎么编程实现的呢? 用两块蓝牙模块进行数据透传,主单片机将数据传给主蓝牙模块,从蓝牙模块接受到主模块 数据后传给从机并显示数据. 解决方案 这个要读HC05特定功能时序图,设置好控制寄存器之后,按时序图的规定实现.参见HC05的Datasheet. 解决方案二: 分别60S2的TX和RX接上一个HC05的RX和TX,然后把蓝牙当串口发送和接收就可以了,还有不懂可以追问

oracle从一张表中根据不同条件查询出两个结果 然后查出两个结果中相同的数据

问题描述 oracle从一张表中根据不同条件查询出两个结果 然后查出两个结果中相同的数据 这是表中数据 我用下面这种方法 select * from ((select * from SFFX_JGJPZ_DETAIL d where d.jgjpz_id=1) o), ((select * from SFFX_JGJPZ_DETAIL d where d.jgjpz_id=8) t) where o.platename=t.platename ; 查出来的结果对的 却在一行 怎么解决.. 解决方

MSNBC买下“突发新闻”域名两路切入微博客

DoNews 1月6日消息 1月6日,据国外媒体报道,美国第四大有线新闻频道MSNBC近日收购 "breakingnews.com" 域名,计划兵分两路切入微博客新闻领域. 消息称,MSNBC已于2010年1月5日完成收购"breakingnews.com" 域名,但具体交易细节不详.2009年12月,该公司曾收购另一家新闻服务公司BNO在Twitter上的账号"BreakingNews". 据了解,BreakingNews是新闻服务公司BNO在

两条官员微博引发网民围观

新华网记者陈元 近日,有两条官员微博引发网民围观.一条是陕西省公安厅副厅长陈里在其个人实名认证的微博上"邀请农民工兄弟吃饭",另一条是山东省枣庄市山亭区卫生局局长关继标在微博上发"不开微博就辞退"的言论."邀农民工吃饭"的微博获得网友"释放善的力量"的赞誉,"不开微博就辞退"的内容和当事人则为网友们所诟病. 同样是官员微博,内容同样都和工作相关,为何会得到迥然不同的评价? 实际上,"邀请农民工兄弟

两年里发布微博162万余条

http://www.aliyun.com/zixun/aggregation/1144.html">腾讯微博网友@KaNgKaN两年里发布微博162万余条,其微博内容各种各样,有纯粹吐槽的,有讨论话题的,有回复网友的,有转发评论的,也有对手机设备进行讨论的.如此大数量的微博刷屏,却仍有近十万的听众,可见其是个成功的"刷屏牛人".网友对其询问的问题也不少,多是惊诧其庞大的微博量,其中也不乏对手机装置等进行询问的.也有网友表示难以置信.对此,KaNgKaN发微博称自己只是