Google研发新的验证码生成算法来应付问题

摘要: 对于用街景车采集地图信息的Google来说,怎么让机器看懂每家风格和字体都不同的门牌号是个问题,因此衍生出了Google的图像识别算法据Google在近几天的ICL上更新的paper来看,Google在这

对于用街景车采集地图信息的Google来说,怎么让机器看懂每家风格和字体都不同的门牌号是个问题,因此衍生出了Google的图像识别算法——据Google在近几天的ICL上更新的paper来看,Google在这方面的识别精确率已达到90%以上。

但这也造成一个问题:如果机器可以轻松识别包含文字信息的图像的话,那么各网站用于安全保护的验证码也就可以轻松被破译了,Google说,他们发现目前有种算法可以使破译的准确率达到99.8%以上。

为此,Google不得不加以应对——通过研究出机器很难理解而人类可以看懂的方式,来扭曲字体,重构验证码,使其reCAPTCHA项目可以应对这种破译算法。如果感兴趣的话,你可以点击查看reCAPTCHA项目,以及Google最近更新的研究论文。

时间: 2024-09-12 23:23:29

Google研发新的验证码生成算法来应付问题的相关文章

Google不得不研发新的验证码生成算法

摘要: 对于用街景车采集地图信息的Google来说,怎么让机器看懂每家风格和字体都不同的门牌号是个问题,因此衍生出了Google的图像识别算法据Google在近几天的ICL上更新的paper来看,Google在这 对于用街景车采集地图信息的Google来说,怎么让机器看懂每家风格和字体都不同的门牌号是个问题,因此衍生出了Google的图像识别算法--据Google在近几天的ICL上更新的paper来看,Google在这方面的识别精确率已达到90%以上. 但这也造成一个问题:如果机器可以轻松识别包

“HillTop”论 - 探索Google排名新算法(二)

    此外,若两个站点均为相同IP地址下的宿主,则认为其中一个是另外一个站点的成员站点.(即:若ww.abc.comwww.ibm.com均为相同IP地址下的宿主,则认www.abc.com是www.ibm.co.uk的成员站点)     Hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎 认为数量足够的"专家文件"(要求至少需有两票),则该算法失效,即返回结果为零.换言之,对于高度明确化的查询条件(查询词语),Hilltop算法的结果很可能为"0".

“HillTop”论 - 探索Google排名新算法

     Hilltop算法是否以实时方式运行     Google所拥有的服务器体系架构就是网络上分布的一万台奔腾级服务器.而一旦了解了Hilltop算法后,我们很难相信这样的奔腾服务器能够具备如此的处理能力:试想一下,首先要从成千上万的主题性文件中找到"专家文件",然后计算目标网页自这些专家文件的链接的得分,然后再将数值返回Google算法的其它排名系统,并做进一步处理-而所有这些要在大约0.07秒内--这个让Google举世闻名的搜索速度内完成.确实使人难以置信.     Hil

Google排名新算法之二

第二部分: 探索Google PageRank新算法2-1. Google的主题性趋向 2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的"随机运动"来告诉你哪些站点是最重要的.该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按"返回"按钮这一过程.页面的等级越高,则随机网络冲浪者发现它的机率亦越高. 这种思路其实相当富有创意.一个网页的外

Google排名新算法之三

第三部分: 如何在Google新算法中拔得头筹 如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施. 3-1. 关键词的研究:扩大覆盖面搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体.但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇.关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称.地理位置及修饰语等"修饰成分". 尽管对网站的每个页面只能围绕两到三个关键词进行关

Google更新新算法蜂鸟 应对整句搜索时代

蜂鸟算法是什么? Google并未透露太多有关蜂鸟算法的技术细节.不过他们表示,这是自2010年"咖啡因"(重点放在速度和整合社交网络搜索结果上)以来最大的一次算 法更新,大约会影响"近90%的搜索结果".并且Google反复提及,蜂鸟算法可以更快速地解析整个问题(而非一个词一个词地解析搜索),从索引的内容 中识别问题答案并排名.此外,Google表示,该算法已经部署数周之久. PR算法被取代了吗? Google给的答案是NO.PR是蜂鸟算法中200多个计算指标其中

全排列生成算法 .

参考链接: 全排列生成算法(一) 原文讲的很详细了,为了完整性,这里粘贴的参考链接中大部分文字,并且在原文的基础上,添加了"给定某个排列,求其字典序中上一个元素"的算法. 字典序 全排列生成算法的一个重要思路,就是将集合A中的元素的排列,与某种顺序建立一一映射的关系,按照这种顺序,将集合的所有排列全部输出.这种顺序需要保证,既可以输出全部的排列,又不能重复输出某种排列,或者循环输出一部分排列.字典序就是用此种思想输出全排列的一种方式.这里以A{1,2,3,4}来说明用字典序输出全排列的

java中全排列的生成算法汇总_java

  全排列的生成算法就是对于给定的字符集,用有效的方法将所有可能的全排列无重复无遗漏地枚举出来.任何n个字符集的排列都可以与1-n的n个数字的排列一一对应,   因此在此就以n个数字的排列为例说明排列的生成法.   n个字符的全体排列之间存在一个确定的线性顺序关系.所有的排列中除最后一个排列外,都有一个后继:除第一个排列外,都有一个前驱.每个排列的后继都可以从它的前驱经过最少的变化而得到,全排列的生成算法就是从第一个排列开始逐个生成所有的排列的方法.   全排列的生成法通常有以下几种:   字典

百度和google对新站的处理方式

百度和google对新站的处理方式 百度和google是seo们的两个主攻对象,也是中国两个最大的竞争对手,这篇文章就目前这两个搜索引擎对待新站的不同态度进行一下主观的分析. google对待新站一般都是远近文明的"沙盒效应sandbox",最近好像出现了一种我所猜想的"单页面沙盒"的现象,至于什是沙盒我想大家可以去其他搜索引擎查看一下,很容易找到. 以前的google在收录新站的速度上一般都比较慢,收录的数量也很少,但最近似乎是为了更加符合中国国情,极大的加快了收