加强版 Captcha 让机器彻底蒙圈，正误验证码傻傻分不清

Captcha（全自动区分计算机和人类的图灵测试，俗称验证码）是目前用于区分人和机器主要办法，其工作原理是通过提供模糊或是有歧义的图片，并要求用户进行回答，以此来区分人和机器。而 Captcha 能有效地区分出人和机器主要是依靠以下两个方面，一是人在面对问题难度增加时，可以随机应变；二是机器不能很好地文本识别。但是随着计算机的逐渐发展，机器回答 Captcha 问题的能力逐渐超过了人类，因此，加强版 Rip Captcha 也应运而生。

在字母识别任务 circa 2005 中，计算机的识别能力已经超过了人类，并且也征服了 Gmail 的验证码。尽管目前大部分的 Captchas 还是可以区分多数的机器，但是随机计算机不断地进化，能区分出的机器会逐渐减少。所以目前最紧急的问题是如何建立一个更好的 Captcha 系统，以应对逐渐进化的计算机视觉。

来自韩国大学的两位教授，Shinil Kwon 和 Sungdeok Cha 基于图像基础研发了新的 Captcha 系统。这一系统中的图片会具有时效性，问题的答案会随着时间的不同有所变化。所以，机器不能通过随机猜测得出答案。这个系统的能区分人和机器的关键在于：在没有试验或是相关经验的情况下，机器的智能性会大打折扣。

经典的文本识别 Captcha 系统不是讨论的重点。我们仅仅是在假设 Captcha 的答案是固定的基础上，进行进一步研究。Cha 和 Kwon 的研究重点就是关注 Captcha 系统的下一级迭代，即从图像中提取信息。

via Cha et al

Cha 和 Kwon 在 IEEE Software 上发表的论文表示：“尽管计算机视觉十分地强大，但在在语义识别方面好有所欠缺。”举个例子，在大量的图片中，选择比尔盖茨出现过的图片。尽管这一问题对于机器来说不是很难，但是我们要想一下机器每天会识别多少图片——大概是 100 万张。每一次试验就代表着机器对任务有新的认识，因此在下一次识别成功的几率就会更大。

“如果机器能侥幸通过任务测试，它们就可以记录下所有相关信息，在未来任何的挑战中都可以用得到。”Cha 和 Kwon在论文中写道，“或者进一步说，机器可以使用商业搜索引擎，搜索相关的图片标签或是相似的图片，加深对图片的理解。”

Cha 和 Kwon 的解决方法是在 Captcha 系统中输入一系列的图片，其中包括正确答案，错误答案，并且有些正确的答案是在旧版的 Captcha 系统中就有涉及。一般来说，我们都会认为 Captcha 的图片都是标注为正确或是错误，但是这一新的 Captcha 系统还有第三种结果，中立可能性。人和机器选择或是不选中立的答案，对于结果都不会有影响。并且，这些中立的答案会随时改变，所以表面看尽管看起来是一样的，但是实际上却有所不同。

机器通过随机猜测获取正确答案，但是却并不是真正意义上的学习，因为它不知道为什么错或是为什么对。在引入新的系统之后，机器的随机猜测就会变得毫无意义，因为机器在试验时并未意识到有些答案是中立的，并且在通过测试之后，机器会直接将这一中立答案认定为正确答案加入自己的数据库中。

此外，通过引入“陷阱”数据，这一系统还能进行进一步优化。“陷阱”数据的实现是通过将中立答案与特定 IP 地址联系起来。因为机器一般都是基于特定的 IP 地址进行识别，在之前的测试中，机器人错将中立答案当做正确答案，并将其加入到自己的数据库之中。所以机器在面对同一问题时，会错将中立答案当做是正确答案进行回答。此外，有时错误的答案也会标记成中立答案。

在测试新的 Captcha 系统时， Cha 和 Kwon 发现机器在 2,250,000 次测试中，机器的成功的几率仅仅只有 2.3%，几乎是接近于零。“由于随机和实时的中立图片，机器的数据库就不能保证所有通过测试的答案都是正确的，另外机器也不会进行错误更正。” Cha 和 Kwon 在文中写到，“我们发现在机器的数据库中有2,465 张图片中（大约有19.9%）都进行了错误的标记。”人在在没有陷阱数据的情况下，成功率为 79.3%；在有陷阱数据的情况下成功率为 64.5%。人与机器的成功的几率相差很大，所以在引入新的 Captcha 系统可以更有效地区分机器和人。

本文作者：陈圳

本文转自雷锋网禁止二次转载，原文链接

时间： 2024-11-05 19:34:09

加强版 Captcha 让机器彻底蒙圈，正误验证码傻傻分不清的相关文章

切勿急功近利浅谈被SEO整蒙圈了的那点事

SEO这项互联网技术虽说门槛低,但谁也不能说我已经完全掌握了搜索引擎的算法,大多还是靠着经验和掌握的知识在不断摸索学习罢了.正因为这样,SEO是个具有一定风险性的项目.在做任何SEO的方案时一定要慎重,不可急功近利,不求最快但求稳健,是每个SEOer都要懂得或需要磨练的必修课. SEO的知识有很多,但并不是每一个都完全正确或者适合你,关键是看用的时机和力度,点石成金认为SEOer是越老越值钱,就跟中医似地,一把脉就知道开什么方子,剂量拿捏的也很到位.这都是通过不断的实践和教训总结积累出来的,

价格战后遗症：图书成电商圈地首选短期难分输赢

"图书不赚钱,从上线就一直在赔钱--"不断有http://www.aliyun.com/zixun/aggregation/7578.html">电商企业在扩充了图书品类后向凤凰科技表示. 作为电子商务的切入品类,图书以其低门槛.标准化运营的特点,成为众多电商的基础品类,随着苏宁.京东.腾讯电商.天猫等公司加入图书大战,更多的公司呈现出前仆后继,热情不减的趋势. 价格战加速电商图书领域圈地一位电商行业的从业者向凤凰科技透露,图书作为重要的促销品类,在电子商务所有的品类

PHP开发框架Yii Framework教程(20) UI组件 Captcha示例

Captcha(全自动区分计算机和人类的图灵测试-Completely Automated Public Turing test to tell Computers and Humans Apart,简称CAPTCHA)俗称验证码,是一种区分用户是计算机和人的公共全自动程序.在CAPTCHA测试中,作为服务器的计算机会自动生成一个问题由用户来解答.这个问题可以由计算机生成并评判,但是必须只有人类才能解答.由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类. Yii

人工智能综述：让机器像人类一样思考

长久以来,我们一直认为智能不只是人类所独有的,可以像人类一样进行推理和学习的机器是完全可能被制造出来的,然而事情却不像想的那样简单. 模拟人工智能在百科全书上,人工智能的定义是"研究可以智能工作的机器的科学和工程".不过一个令人纠结的问题是:到底什么是智能?很多情况下,那些"不智能"的机器比我们聪明多了,比如普通的计算机程序可以将成千上万个数字的乘积,可以记录下银行的大量款项,这已经超出了普通人的能力.可是,他们只是能正确地完成大量计算而已,还称不上真正的&quo

老谢：公益营销蒙牛的企业公民

中介交易 SEO诊断淘宝客云主机技术大厅老谢最赞成的还是公益营销,这样的好好多多. 如今的经济已经进入了一个全球化竞争的时期,一个品牌如何被消费者关注,如何让消费者产生好感,乃至忠诚,是每个企业天生的使命.然而,在信息过剩的时代,面对信息无孔不入的环境,消费者是被动的,是懒惰的,也是自私的,传统的市场运作已经不足以引起消费者的兴趣.因此,企业必须抛开单纯为销售而销售的行为,从消费者的心智出发,搭建一个能让消费者认同并且具有社会公信背景的平台,实施人性化的营销活动,让公益行为与营销活动捆绑

娱乐圈的另类生态靠花边新闻走红的明星

张钰张钰出生在湖北省农村,很小的时候,一家人砍柴的时候发现了她,也不知道亲生父母是谁.小的时候她是长在农村的,8岁的时候他到一个中等城市生活,城里的孩子对她有歧视观念,所以导致上小学.初中的时候真是非常坎坷.父亲是军人.当时的父亲非常有眼光,复员就业时选择了电力行业从事工作.张钰认为爸爸的聪明和魄力"遗传"给了她,令她也很"独具慧眼". 之后她来到北京,1997年进入了北京电影学院表演艺术班. 毕业后,大半年没有一个角色,张钰觉得以一个女子的力量改变自己真得很困难

站长的2013 看这一年互联网圈又发生了什么

中介交易 SEO诊断淘宝客站长团购云主机技术大厅 2013年过去了,这一年互联网圈发生了不少,并购.上市.互联网金融.P2P网贷.BAT大战.剑灵--这一切跟我们蛋关系都没有. 我一直在思考:我们的2013-- 2013年,科技博客火了.自媒体火了.微信营销火了.人人都有APP了.比特币也火了.互联网金融来袭. 2013年,外链行业萎了.淘宝萎了.微博萎了.社会化评论萎了.社会化分享也萎了. 新事物的诞生,必将挤兑老事物,2013年,站长越来越受待见了,不过我们也要逃离北京了下面,听我一

微信朋友圈广告,委身求全迎合LOW需求是必然

微信 2015年1月21日,对于微信而言,这绝对是一个值得纪念的日子.它的意义不仅在于微信朋友圈开始告别过去的纯净时代,开始投放Feed广告,更多的在于从现在开始,微信从现在开始,已经不可避免的进入了一个类似于QQ的发展模式. 微信之所以能够在品牌和用户体验上超越其它对手,原因有两个: 第一,微信重构了QQ的好友关系链,在移动互联网的时代,微信的快速崛起很大程度上来源于QQ将PC时代积累的社交链的导入,而在这个过程中,其实是对QQ好友关系做了清洗和重构,这使得微信相比其它竞争对手能够得到通讯录好

七个HR总监容易懵圈的大数据工作职位

大数据时代,数据驱动型企业的决策质量和效率将远超竞争对手,但无论大数据也好,小数据也罢,企业的庞大数据资产如果没有专业人才点石成金,也只能是污染环境的矿渣,而数据分析专家,如今正是企业数字化转型中最热门的人才.以下IT经理网根据Glassdoor的招聘数据统计,为大家整理目前最为炙手可热,同时又容易让企业人力资源总监"傻傻分不清"的大数据高薪职位,供大家参考: 一.数据科学家数据科学家是过去几年最吸睛的数据分析金字塔尖岗位,同时也被Glassdoor评为工作生活平衡度最好的高级IT职

猜你喜欢

折半查找

//****************************************** //折半查找---传进来的表是经过排序后的有序表 // //************************* ...

Linux环境使用TC进行服务器流量控制方法

公司目前有一台服务器,网络环境太高,那台服务器和源服务器连接下载,就跑到400M-500M,为了控制一下,所以研究了一下TC,来做流量控制.给他控制到小点,不要让这一台占了所有的网络.TC很强大,很多 ...

用商铺做长尾词垄断流量

当我们把主关键词做到首页以后发现带来的订单并不如我们想象的那样,是我们的网站做的不好还是本来转换率这么低呢?其实还有很大一部分流量被长尾词分流去了,对于还是几个月的新站怎么做长尾词?肯定是行不通,所以 ...

成功的产品设计:要懂得取舍之道

文章描述:产品的取舍之道. 经常有人给我说或是我自己给别人说: 某某现在极其火爆的产品所做的东西我xx年前就想到了,只不过因为xx原因未做成: 某某现在极其火爆的产品所做的东西我xx年前就已经做过了, ...

使用动画转换创建生动的用户体验

典型的应用程序生存期由一些状态组成:数据输入表单.结果界面.含有各种图像的相簿.含有项目的购物车等等.通常,应用程序执行繁重的任务使用户在这些不同的界面中切换:新的界面替代原来的表单,突然在屏幕中弹 ...

IE10中“粘贴并转到”功能使用

在IE10中,微软对这项功能做了优化,让我们使用起来更加方便. 当我们复制一个网站以后,在其他浏览器中只要在地址栏中点右键,可以选择"粘贴并转到".IE9中则需要打开一个页面以后, ...

PS将普通照片做成时尚广告写真

原图最终效果 1.初调画面的明暗对比,并降低饱和度. 2.初调皮肤色彩,并擦出高光. 3.液化处理后,整体着色,并画出眼影. 4.描画眼线. 5.处理睫毛. 6.处理嘴唇. 7.添加素材,丰富画面. ...

Win7下打印服务器安装设置图文教程

本文将教大家在win7下怎样安装打印服务器. 如果您之前从未使用过打印机,现在想要通过打印服务器来实现共享打印机,您需要按照以下的步骤来添加一个打印机端口并安装打印机的驱动. 1.选择开始 --控制面 ...

右键菜单有两个“记事本”怎么办

win7系统右键点击文本类文件选择"打开方式"的时候通常会有一个"记事本"选项,我们可以直接点击右键打开"记事本",最近有win7系统用 ...

摄像头-Android 后台静静地拍摄

问题描述 Android 后台静静地拍摄请问各位兄台,Android如何实现后台静静地使用前置摄像头拍照?就像这个程序那样http://pan.baidu.com/s/1sjKJJ8h 解决方案你 ...

类型“DataAccess”同时存在于“c:\Windows\Microsoft.NET\Framework\v2.0.50727\Temporary ASP

问题描述在网上查了好多,说要删除bin文件夹,和c:WindowsMicrosoft.NETFrameworkv2.0.50727TemporaryASP.NETFiles里的文件,删过了,运行还是 ...

《jQuery、jQuery UI及jQuery Mobile技巧与示例》——9.15　技巧：优化header和footer以便全屏查看

9.15 技巧:优化header和footer以便全屏查看 jQuery Mobile提供了一个叫做"全屏模式"的功能.它表示,在默认情况下header和footer是覆盖在con ...

ad 域访问报错-ad 域验证报LDAP: error code 49 - 80090308: LdapErr: DSID-0C0903A9错误

问题描述 ad 域验证报LDAP: error code 49 - 80090308: LdapErr: DSID-0C0903A9错误 public String checkLogin(String ...

如何判断数据库中select取到的值是空

问题描述 StringSqluser="selectuserfromuserinformationwhereUserId="+UserId;ResultSetrst2=null;r ...

布局-EditText获取焦点后，如何让ScrollView不自动调整

问题描述 EditText获取焦点后,如何让ScrollView不自动调整 @鸿洋-西安 ,@各位好心人按照鸿洋大哥的一篇文章,自定义一个ScrollView,进行上下切换,但是点击"上A ...

ios-各位大神来帮看看这个关于iOS开发者账号的问题

问题描述各位大神来帮看看这个关于iOS开发者账号的问题事情是这样的我公司有一个开发者团队账号我在Member Center ----> people 添加我的apple ID 为开发者 ...

如何捕获java线程中的逃逸的异常

在java线程中,在run方法中,我们要在run()方法中,把一切的异常有处理掉,也就try-catch掉.不能让这个线程抛出异常,因为如果我们不使用特殊的方式的话,我们是无法捕获从这个线程中逃逸的异 ...

don't touch /var/lib/docker during run container else ERROR: device or resource busy

我用的环境是CentOS 6.5 x64, docker-io-1.1.2-1版本. docker-io包来自EPEL, [epel] name=Extra Packages for Enterpr ...

Knockout应用开发指南第十章：更多信息（完结篇）

原文:Knockout应用开发指南第十章:更多信息(完结篇) 1 浏览器支持 Knockout在如下浏览器通过测试: Mozilla Firefox 2.0+(最新测试版本:3.6.8) Goo ...

c++函数中的指针参数与地址参数区别介绍_C 语言

比如一个函数 chat(link &a): chat(ling *a): 前者引入一个地址做形参是不是可以把一个指针变量p.. 这么用chat(p): 那跟第二个函数有什么区别呢都是传 ...

javascript-html加载js文件为何会影响结果

问题描述 html加载js文件为何会影响结果我在看javascript dom编程艺术的时候,第十章的第二个程序,在html中导入J文件,居然因为没有把addLoadEvent.js放在第一位出错. ...

关于.Net从数据库读html代码编译后时 &amp;amp;nbsp; 被编译成“？”的问题

问题描述关于.Net从数据库读html代码编译后时被编译成"?"的问题本人用在线编辑器把一些HTML代码写进了数据库后在.net里用Server.HtmlDecode对数据库的 ...

c++-C++ 6.0结构体数组排序的顺序问题，排序后的顺序规则

问题描述 C++ 6.0结构体数组排序的顺序问题,排序后的顺序规则 C++ 6.0利用函数指针高效排序同时保证结果正确有序的方法是什么?如果结构体中是浮点数字段,具体怎么排序才能正确? 解决方案参考 ...

“大数据”并不能优化贷款

"大数据"是否能辅助我们做出更好的贷款选择?这是一个实时热点的问题,因为一些由硅谷大公司创投的初创公司正在使用大数据技术,以提供短期小额贷款.这些公司希望能帮到68万被联邦存款保险 ...

atom编辑器有提示bootstrap的插件么

问题描述 atom编辑器有提示bootstrap的插件么如题,想找个可以提示bootstrap的插件,希望可以更加高效解决方案 https://atom.io/packages/atom-boot ...

【拉勾网职位需求信息爬虫】技能长尾关键词抓取——看看你是否满足企业技能需求（转）

写在前面不同的语言,有它们各自擅长的应用场景,选择一门适合自己的语言需要勇气与毅力. 而当你下定决心要在甄选的语言上一条道走到黑的时候,孰不知,选择才刚刚开始. 一门编程语言往往有许多分支,每一个分 ...

JS中批量给元素绑定事件过程中的相关问题使用闭包解决_jquery

在JS中,你写一个for循环的时候,内部的循环变量I其实是会保存在它运行的函数或类内的,所以你会发现你给元素批量绑定事件的时候,出现i=最后一个循环变量的值,这就很坑爹啊,解决的方案有2钟, 思路就是 ...

官方价值5000多元的创力SQL商业版下载_常用工具

这个程序不要我多说.去官方看看商业版的价格就知道是多少钱了. 是一个朋友给我的.我放在电脑里也没有什么用就免费提供给大家下载了. 主要目的就是吸引大家来论坛. 要是我骗你们.不是商业版的话.你直接骂我 ...

ColdFusionMX 编程指南 ColdFusionMX Basic Tag编程_ColdFusion

第四期:ColdFusionMX Basic Tag编程序言任何一种程序再简单也要具备一定的逻辑和算法,Coldfusion也不例外.如果只是靠简单的标签的堆砌,是无法真正实现企业商业 ...

解决wordpress emoji 表情加载报错问题方案

wordpress 升级到 4.2 以后的版本,增加了 emoji 表情.该表情使用了如下 CDN 远程加载: http://s.w.org/images/core/emoji/72×72/ 问题在于 ...

热搜