浅谈图形验证码的识别!

    本问所讲的技术只是验证码识别的初级技术,只能识别一些简单的验证码,比如符合下列部分条件的:字体工整、位置固定、颜色统一、没有干扰点、背静单纯,初步体现了OCR原理(非常弱智:)
     本文讲的是通过抓特征点来达到识别目的。图片由一个一个的点(像素)组成,点的颜色变化就组成了我们看见的图片,呈现一个图象就是那几个点按照一定的顺序排列而已。
         比如csdn使用的验证码(下图),去掉上下左右的白边,每个数字使用8*12=96个像素,兰色的点就是我们看到的数字了,0-9这10个数字兰色点都是固定的,比如"4"就是是(0, 6)(0, 7)(1, 5)(1, 7)(2, 4)(2, 7)(3, 3)(3, 7)(4, 2)(4, 7)(5, 1)(5, 7)(6, 0)(6, 1)(6, 2)(6, 3)(6, 4)(6, 5)(6, 6)(6, 7)(6, 8)(6, 9)(6, 10)(6, 11)(7, 7)这些点组成如何得到,继续后面。
看起来复杂,实际上是很简单的,先简单处理下,你也许看的很明白,比如csdn登陆的验证码    ,用mspaint.exe(画图)打开,放大到800%(查看--自定义--800%),
,这里显示图片是一块一块组成了,现在我们需要把验证码的每个字符独立处理,就要确定字符范围了,如何确定?还是在mspaint.exe中,使用"选定"工具,保证每次划的框刚好把数字完整“框”起来,并且没有多余的空白……稍微花点工夫,就可以确定范围:四个字符的范围范围分别是以(3,4)、(12,4)、(21,4)、(30,4)作为左上角宽度是8高度是12的矩形。这些就是我的源代码里面
       Dim Rc1 As New Rectangle(3, 4, 8, 12)
         Dim Rc2 As New Rectangle(12, 4, 8, 12)
         Dim Rc3 As New Rectangle(21, 4, 8, 12)
         Dim Rc4 As New Rectangle(30, 4, 8, 12) 所定义的4个范围的由来了。

时间: 2024-09-20 13:27:09

浅谈图形验证码的识别!的相关文章

浅谈利用搜索引擎无法识别JS做黑帽SEO

最近福清SEO看到很多网站使用黑帽技术,主要是利用蜘蛛不能很好识别JS文件而钻空子. JS全称Javascript,是一种计算机脚本语言,主要在浏览器客户端解释执行,Javascript语言可以被嵌入HTML文件之中,可以做到回应使用者的需求事件而不用任何网络来回传输资料.所以当一位使用者输入资料时,它可以直接被客户端应用程序所处理.有兴趣的朋友可以参考下百度百科解释. 福清SEO看到上海某公司利用JS文件加密,做了一个高级的隐藏技术,让蜘蛛和访客看到的页面是不同的,主要是做隐藏链接和挂黑链.笔

浅谈验证码的识别技术

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 这些天出于一些需要,要求做程序识别某网站的验证码,于是潜心研究了一番,颇有心得,特此分享. 编辑推荐:学习网络赚钱.网站运营 .网络营销推广请登录--选学网 http://www.xuanxue.com 验证码识别这项工作不适合浮躁的人,它需要足够的技术和耐心.由于此技术的特殊性,任何一个被公开识别技术的验证码都会很快地失效,相关网站都会很快

“图”说天下:浅谈图片搜索功能

随着360综合搜索不断地开拓进取之后,新上线了图片搜索功能.百度图片搜索每天的百度预计流量为781万4070,这还仅仅只是百度来的预计流量,实际上更多.搜索引擎市场的竞争是多元化的,不仅仅是搜索结果的竞争,包括图片.音乐等栏目的竞争也日趋日烈.360图片搜索推出以后,图片搜索市场也是"百家齐鸣",百度.谷歌.搜狗.即刻等等都开始在图片搜索领域争奇斗艳.下面笔者就开始用"图"说天下的图片搜索市场. 1.百度图片(http://image.baidu.com) 百度图片

[ASP.NET] 图形验证码破解-以简单图形为例

原文 http://www.dotblogs.com.tw/joysdw12/archive/2013/06/08/captcha-cracked.aspx 前言 这次来讲个比较有趣的主题,就是该如何破解网路上那些防止机器人攻击的图形验证码,谈到图形验证码破解,想必各位嘴角一定微微上扬了吧XD,看来学坏好像都比较有兴趣一点,但其实知道破解的原理后,之后要做防范也比较清楚该如何处理了← 主因:P.   在开始破解前先来看一下基本上的破解原理与方法,可以先参考此篇  使用PHP对网站验证码进行破解 

浅谈php安全性需要注意的几点事项_php技巧

在放假之初,我抽时间看了<白帽子讲web安全>,吴翰清基本上把web安全中所有能够遇到的问题.解决思路归纳总结得很清晰,也是我这一次整体代码安全性的基石. 我希望能分如下几个方面来分享自己的经验 把握整站的结构,避免泄露站点敏感目录 在写代码之初,我也是像很多老源码一样,在根目录下放上index.php.register.php.login.php,用户点击注册页面,就跳转到http://localhost/register.php.并没有太多的结构的思想,像这样的代码结构,最大的问题倒不是安

图标字体化浅谈[转]

在做手机端Web App项目中,经常会遇到小图标在手机上显示比较模糊的问题,经过实践发现了一种比较好的解决方案,图标字体化.在微社区项目中,有很多小的Icon(图 标),如分享.回复.赞.返回.话题.访问.箭头等,这些Icon(图标)一般都是纯色的.开始制作时考虑用双倍大小的Sprite图,通过CSS样式设 置只显示二分之一尺寸,这样在Retina屏上显示的大小是正常的,一旦放大屏幕后图标又变得模糊不清,测试的效果不是很理想,后来又考虑多套图标适配方 案.SVG矢量图等,都因为种种原因放弃掉了(

互联网产品市场:浅谈抄袭和适度创新

文章描述:互联网产品市场:浅谈抄袭和适度创新. 前几天参加敏捷大会,最大的收获乃是听到腾讯副总裁的这番回答,对这个问题有了重新的认识(或者说重新陷入迷惑,也行). 腾讯一直以来被认为是抄袭专家,创业杀手,甚至有"gouridetengxun"说法,马化腾自己也有"喜欢慢人半步"的言论,所以似乎一切都已经有定论. 那天底下一位观众问及此问题,吴军的回答如下(很精彩,凭记忆,有出入,请原谅): view plain MP3是苹果发明的吗?不是:手机是苹果发明的吗?不是:

浅谈TeeChart组件在ASP中的应用

chart 浅谈TeeChart组件在ASP中的应用 由于TeeChart VCL 版本广泛应用于多种开发环境并得到很好的认可,西班牙Steema Software SL公司于1997年10月又开发了TeeChart Pro ActiveX.对于B/S的开发模式无疑是一个好消息,由于它只需安装在服务器端,客户端无需安装其他软件,只要使用通用浏览器即可显示统计图形,因此一面市更是又一次得到极大的欢迎. 下面我们结合ASP技术介绍一下TeeChart Pro V5 ActiveX组件常用属性及应用.

新手站长浅谈搜索结果的不同显示格式(二)

在上篇文章新手站长浅谈搜索结果的不同显示格式(一)中,分别从常规搜索结果.经典搜索结果列表.整合搜索结果.缩进列表方式.全站链接展示等五个方面和大家分享了搜索引擎的五种不同显示格式,当然搜索引擎也不只是这五种显示格式,还有包括迷你全站链接.One-box.富摘要.面包屑导航.说明文字链接等另外五种格式.希望通过本文能让大家更多去了解搜索引擎的基本知识.好了,开始今天的文章. 第六.迷你全站链接:迷你全站链接往往很少见,但对于一些权重高的网站就会出现这种形式.这种方式英文叫做Mini Siteli