为什么必须保护Robots协议?

  一、从Spider程序到Robots协议

  即使不是工程狮,关注互联网的人也很少不知道Robots协议。百度和360从2012年起展开的一场屏蔽与反屏蔽战把原本程序猿才知道的Robots协议变成媒体热词。北京一中院8月7日对3B搜索不正当竞争纠纷案(3B案)刚刚作出的一审判决让Robots协议在新闻里又火了一把。Robots协议的法律地位或法律效力问题是3B案一系列法律问题中最大的争点,分析这个问题就必须先了解Robots协议的内容和意义。

  Robots协议和搜索引擎的爬虫程序(Spider)其实是一对同胞兄弟。

  1994年之前,AltaVista、Infoseek等代表的搜索引擎在互联网可以通过Spider直入网站管理后台,把所有网页信息系数收录。除了涉及隐私外,爬虫程序的反复收录在20年前对网站带宽也是不小的负载。荷兰工程师Martin Koster深感互联网丛林之乱,提出通过设立名为Robots规范的网站访问限制政策(Access Policy)方式在整个互联网统一解决Spider无所不在所带来的威胁。Robots协议在技术实现上并不复杂,网站管理员只要按规则在网站根目录下创建Robots.txt的文本文件就可以禁止搜索爬虫收录指定网页内容。从早期的AltaVista、Infoseek到后来居上的Google 、Yahoo和美国以外的Baidu等各大搜索引擎都群体接受了Robots协议,避免和内容网站为Spider陷入一场危机。

  二、Robots规则可以受法律保护

  反对3B案一审判决的理由集中对Robots协议法律效力的否定上。Robots协议并不是法律,也没有被IETF、ITU和W3C等国际标准组织接纳。但国际标准也不是法律,逻辑上成为国际标准不等于自动享有法律保护。法律和规则并不是同一个概念,法律属于规则,而规则远远大于法律。百度是以不正当竞争为案由起诉360,反不正当竞争法本身就是通过列举加兜底的方式,在少数明确规定的违法行为外以原则性规定了根据不正当竞争行为的判断标准。司法者的权限并不局限于寻找包含Robots协议内容的具体法条,而是可以根据实际案情裁量违反Robots协议是否就违反了反不正当竞争法第二条对经营者应当遵循自愿、平等、公平、诚实信用和公认商业道德的强制性规定。认定违法并不需要将Robots协议上升为法律作为前提,违反规则就可能导致违反法律的结果。况且3B案发生背景之一,是被告奇虎360本身就通过签署《互联网搜索引擎服务自律公约》承诺“遵守机器人协议(Robots协议)”和“限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为”。360在明确承认Robots协议约束力后又规避了协议,既是违法又构成违约。

  法律之外的规则受法律承认和保护是普遍现象。

  合同不是法律而是当事人自由达成的一致意思表示,但依法成立的合同当然受法律保护。《合同法》第八条即规定:“依法成立的合同,对当事人具有法律约束力。…依法成立的合同,受法律保护。”被互联网广泛采用的Robots协议属于行业惯例,仅《合同法》就在第二十二条、第二十六条、第六十条、第六十一条、第九十二条等九个条款承认交易习惯的效力,如第九十二条就规定:“合同的权利义务终止后,当事人应当遵循诚实信用原则,根据交易习惯履行通知、协助、保密等义务”。《物权法》第八十五条也规定:“法律、法规对处理相邻关系有规定的,依照其规定;法律、法规没有规定的,可以按照当地习惯”。根据法理及以上法条的规定,惯例完全有可能获得法定效力及执行力。3B案判决认可Robots协议的效力是法官依职权对Robots协议合法性进行认知的过程,并不存在法官造法或逾越职权创造新权利。

  百度在360推出网络搜索后迅速启用Robots协议,在百度旗下的知道、贴吧、文库、百科等产品屏蔽了360爬虫。百度屏蔽360的产品基本属于用户创造内容(UGC)类型的上传平台。百度对平台内容并不直接享有著作权,360因此质疑百度无权拒绝收录。但UGC平台身份也无碍百度根据《著作权法》第十四条对相关内容享有作为汇编者的权利。在百度主张反不正当竞争保护情况下,举证责任更简化到证明原告合法投入因被告竞争行为受到实际损害及被告竞争行为违反诚实信用或商业道德,而360强行利用百度网站内容已构成搭便车的不正当竞争行为。

  三、互联网拒绝丛林法则

  360在3B案中以百度滥用Robots协议作为抗辩,但换个角度看真正容易被滥用的倒是Spider程序。互联与分享是网络的基本性格,而信息的多元化也决定了很多情况下网络传播必须受到控制。不受Robots协议限制的Spider程序必然使互联网陷入严重混乱,网站后台隐私无法保护,网页更新的旧信息必须完全删除而不能仅仅屏蔽,音乐、视频等内容的收费盈利模式遭到毁灭打击。互联网经过长期博弈逐步摆脱无序状态,难道只因搜索爬虫失控又将回到比拼技术暴力的暗黑丛林?这种情景绝非法治下的互联网可以接受的。

  Robots协议自成立以来在全球受到严格遵守,利用Robots协议屏蔽搜索的案例举不胜举。Facebook和Twitter长期屏蔽谷歌,后者除了发牢骚不敢采取任何规避手段;默多克的新闻集团一度全面屏蔽谷歌,谷歌一直忍到……忍到默多克自己忍不住投降;搜索屏蔽360的除了百度各网站还有腾讯的QQ空间,更有意思的是QQ空间屏蔽360爬虫却在2012年后对百度和Google开放,360甚至都没有为此指责腾讯歧视;腾讯尽管向百度开放QQ空间却将腾讯微博的内容屏蔽至今,新浪微博也一度加入屏蔽百度的队列;电商领域可能是互相屏蔽的高地,淘宝从2008年起一直屏蔽百度搜索,京东、苏宁、当当网等也屏蔽了阿里旗下一淘搜索的爬虫。

  各国法院承认Robots协议效力的判决同样不胜枚举。美国联邦法院早在2000年就在eBay诉BE(Bedder’s Edge)案 中就通过禁令支持了eBay屏蔽BE爬虫的主张。内华达法院2006年审理的Field v. Google 案 也明确认可Robots协议是有效保护网站权利的通行标准。北京一中院同样于2006年在审理著名的浙江泛亚诉百度著作权侵权案 判决书中认定原告有权利用设置Robots.txt文件拒绝百度收录。上述通过Robots协议屏蔽搜索爬虫的互联网实例和认可Robots协议法律效力的中外法院判决,都证明Robots协议的效力并不是在3B案中才成为争点,也证明Robots协议在产业实践和司法实践中都一直得到认可和尊重。

时间: 2025-01-14 17:19:49

为什么必须保护Robots协议?的相关文章

百度:Robots协议是国际通行规范 理应共同遵守

中介交易 SEO诊断 淘宝客 云主机 技术大厅 昨日百度诉奇虎360违反"Robots协议"抓取.复制其网站内容侵权一案,昨日上午在北京市第一中级人民法院开庭审理.百度方面声明称,360搜索在未获得百度公司允许的情况下,违反业内公认的Robots协议,抓取百度旗下百度知道.百度百科.百度贴吧等网站的内容,构成了不正当竞争.据了解,此次索赔金额高达1亿元. 百度:Robots协议是行业规范 昨天上午9时,法庭大门打开,双方的律师团队鱼贯而入,随后书记员搬进该案的证据材料,40厘米高的材料

Robots协议:友好沟通工具而不是竞争武器

中介交易 SEO诊断 淘宝客 云主机 技术大厅 Robots协议(也称为爬虫协议.机器人协议等)的全称是"网络爬虫排除标准"(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取.Robots协议的本质是网站和搜索引擎爬虫的沟通方式,用来指导搜索引擎更好地抓取网站内容,而不是作为搜索引擎之间互相限制和不正当竞争的工具. 在2012年由中国互联网协会举行的<互联网搜索引擎服务自律公约>签约仪式上,百度.即

百度诉360违反Robots协议案开庭 百度索赔1亿元

百度诉奇虎360违反"Robots协议"抓取.复制其网站内容侵权一案,10月16日上午在北京市第一中级人民法院开庭审理. 百度方面认为,360搜索在未获得百度公司允许的情况下,违反业内公认的Robots协议,抓取百度旗下百度知道.百度百科.百度贴吧等网站的内容,已经构成了不正当竞争,并向奇虎索赔1亿元. 2012年8月,360搜索悄然上线后不久即违反Robots协议,强行抓取百度旗下网站百度知道.百度百科.百度贴吧.百度旅游等内容.360搜索在百度Robots文本中还未将360爬虫写入

北京一中院开庭审理百度起诉360“Robots协议”一案

10月16日,百度以360违反其自定的"Robots协议"为由起诉360侵权一案,在北京一中院开庭审理.360方面认为,百度公司滥用Robots协议,设置歧视性条款以达到限制正当竞争的目的,因此,百度所诉的"不正当竞争行为"并不存在,360申请法院驳回百度公司的全部诉讼请求.与此同时,360对百度恶意"强制转跳"等不正当竞争行为也提起了诉讼,北京高院已经受理此案. "百度诉360违反Robots协议"案也被业内称为"

新华社:360被指恶意违反robots协议

新华网北京9月6日电(记者 周文林)百度与360 围绕搜索引擎的纷争近期成为互联网行业最受关注的新闻之一,它也引发了多个涉及技术.行业规范等方面的话题.有专家表示,企业竞争是好事,但不论是哪一方,都应注意遵守行业规范和维护网民利益,从而有利于行业长远的健康发展.对于此次百度与360之间的纷争,不少网民及业内外人士 纷纷发表了意见.易观国际分析师董旭 认为,百度的优势在于品牌.用户习惯和多年磨炼的营销体系.360的优势在于客户端产品所拥 有的用户流量,但撼动百度的市场地位不是一 两天能做到的.他同

百度360搜狗签自律公约 表态支持robots协议

百度360搜狗签自律公约 中国互联网协会在北京举行<互联网搜索引擎服务自律公约>签约仪式,百度.360.搜狗等12家搜索引擎服务企业现场签署<互联网搜索引擎服务自律公约>.这也被认为是针对百度360大战的一个积极回应. 据中国互联网协会胡启恒理事长介绍,本次公约制定充分体现互联网精神,一方面,公约对非法律条文规定.国际互联网界拥有共识的robots协议给予充分尊重和肯定.另一方面,互联网是生而自治,在日后随着互联网技术应用的不断发展,还会有许多新兴问题出现,希望业界能够基于诚信.自

Robots协议:是君子协议也是契约精神,更需法律支持

Robots协议:是君子协议也是契约精神,更需法律支持 阿祥 10月16日,北京市第一中级人民法院开庭,审理奇虎360搜索违反"Robots协议".侵犯百度权益一案.此案涉嫌违反robots协议.破坏行业规则,引起行业.媒体以及法律人士的高度关注. 所谓Robots协议,即爬虫协议,亦称机器人协议.1994年6月30日,在经过搜索引擎人员以及被搜索引擎抓取的网站站长共同讨论后,正式发布了一份行业规范,即robots.txt协议.这一协议确立了两个原则:其一.搜索技术应服务于人类,同时尊

多位法律专家指360违反Robots协议涉嫌侵权

中介交易 SEO诊断 淘宝客 云主机 技术大厅 360搜索上线十余天来,相关争议已不仅局限在互联网行业范围内.360搜索无视百度在Robots 协议中未对其进行授权的事实,对百度知道.百度百科等内容进行强行抓取.对此,多位法律专家认为360已涉嫌侵犯著作权.侵犯法人数据库.不正当竞争等多项侵权违法行为,百度有权对360进行投诉.起诉. 中国互联网协会政策与资源委员会专家.中华全国律师协会会员于国富(微博)律师认为,按照国际惯例,搜索引擎会自觉按照每个网站的"robots协议"给予自己的

方兴东:不要把ROBOTS协议当成竞争的工具

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 近日,搜索界3B大战的一个焦点话题就是:搜索引擎是否一定要遵守 Robots协议?不遵守Robots协议,是否就是窃取隐私?对此,博客网创始人.互联网实验室董事长方兴东表示,Robots协议不该拿来说事,而利用Robots协议打击竞争对手,更是违背开放共享的互联网精神的. Robots协议的来源本来是因为一个网站,由于谷歌的抓取出现技术问题,