百度诉奇虎360违反“Robots协议”抓取、复制其网站内容侵权一案,10月16日上午在北京市第一中级人民法院开庭审理。
百度方面认为,360搜索在未获得百度公司允许的情况下,违反业内公认的Robots协议,抓取百度旗下百度知道、百度百科、百度贴吧等网站的内容,已经构成了不正当竞争,并向奇虎索赔1亿元。
2012年8月,360搜索悄然上线后不久即违反Robots协议,强行抓取百度旗下网站百度知道、百度百科、百度贴吧、百度旅游等内容。360搜索在百度Robots文本中还未将360爬虫写入的情况下,违反Robots协议内容,强制对“百度知道”、“百度百科”等百度网站内容进行了抓取。
百度公司认为,奇虎360的行为违背了国际通行的行业规则、不顾百度的权利声明和技术措施,非法抓取、复制百度网站内容,直接以快照形式向网民提供,严重侵害了百度的合法权益,构成了不正当竞争。随后,百度公司将奇虎360诉至北京市第一中级人民法院,该案于今年2月23日正式立案。
百度公关部郭彪向媒体表示,Robots协议是网站信息和网民隐私保护的国际通行规范之一,理应得到全球互联网公司的共同遵守。不尊重Robots协议将可能导致网民隐私大规模泄露。此前,360服务器抓取网民隐私存在自己的服务器上,因自身网站的漏洞被谷歌(微博)搜索抓取,导致奇瑞汽车内部采购文件、三峡集团财务报表等商业秘密,以及140万网民隐私被泄露和传播。违反Robots协议再次暴露了360无视网站版权和网民隐私的一贯思维。奇虎360也因此遭到国家版权局、国家工商总局等权威部门严厉批评。
郭彪表示,奇虎360最为恶劣的,并非是其搜索爬虫故意违反Robots协议的做法,而是它利用360浏览器等客户端,强行抓取网民的浏览数据和信息到搜索服务器,完全无视Robots协议。这一做法目前已经导致大量企业内网信息被泄露。去年底,百度工程师通过一个名为“鬼节捉鬼”的测试,证明了360浏览器存在私自上传“孤岛页面”等隐私内容到360搜索的行为。
郭彪说,这类利用客户端上传信息并放到搜索上的行为,可能引发网民隐私大面积泄露。如果一位证券公司的工作人员,不慎用360浏览器查看了客户的姓名、银行账号、密码等信息,那么客户账号和密码可能就会被搜索到并公之于众;如果一个公司高层,用360浏览器查看了公司内部机密数据,那么这个公司的核心商业机密也可能就会被竞争对手直接搜索到。
知名IT评论人洪波(微博)指出,“(360无视Robots协议)这样的行为不及时从法律和政府监管上制止,所有网站都可以像360一样践踏行业规则的底线,整个互联网行业将大乱。”
知名知识产权律师赵占领认为,360采用技术手段避开百度设置的版权保护措施,未经许可直接抓取并复制相关产品网页,涉嫌著作权侵权。同时360通过隐蔽访问来源等技术绕开了百度设置的保护措施,未经许可加以抓取,则涉及不正当竞争。北京市汉卓律师事务所首席律师赵虎也表示,根据《侵权行为法》和《民法通则》等一系列法律法规的规定,360搜索行为已经违法,由于360搜索的违法行为涉及面广、涉及人多,已经侵犯了社会公共利益,政府部门不能坐视不管,必须进行调查和处理。
针对百度的说法,腾讯科技连线360公司,一直未得到对方的正式回应。
何为Robots协议
Robots协议,又称机器人协议或爬虫协议,该协议就搜索引擎抓取网站内容的范围作了约定,包括网站是否希望被搜索引擎抓取,哪些内容不允许被抓取,网络爬虫据此“自觉地”抓取或者不抓取该网页内容。自推出以来Robots协议已成为网站保护自有敏感数据和网民隐私的国际惯例。