PHP图像识别技术原理与实现

其实图像识别技术与我们平时做的密码验证之类的没有什么区别,都是事先把要校验的数据入库,然后使用时将录入(识别)的数据与库中的数据做对比,只不过图像识别技术有一部分的容错性,而我们平时的密码验证是要100%匹配。

前几天,有朋友谈到做游戏点击抽奖,识别图片中的文字,当时立马想到的就是js控制或者flash做遮罩层,感觉这种办法是最方便快捷效果好,而且节省服务器资源,但是那边提的要求竟然是通过php识别图像中的文字。

赶巧那两天的新闻有:1、马云人脸识别支付;2、12306使用新的验证码,说什么现在国内的抢票软件都不能用了,发布不到一天就被破解。然后又很凑巧的那天早上看了一篇Java的图像识别技术文章。于是就琢磨着看一下PHP的图像识别技术。

其实所谓的图像识别,已经不是什么新技术了,起码我找到的资料都是很早之前的了。只不过我一直没涉及到这方面的工作,就一直没看过。

先说下这次实验的需求:有一张图片,里面三个位置分别有三个数字,要求取出相应位置的数字的值。(眼尖的同学可能会看出下面的代码是我拿的别人的,没错,的确是我直接copy别人并删减的,毕竟我对这些也是浅尝辄止,最后会贴出原作者的初始代码)

class gjPhone { protected $imgPath; // 图片路径 protected $imgSize; // 图片大小 protected $hecData; // 分离后数组 protected $horData; // 横向整理的数据 protected $verData; // 纵向整理的数据 function __construct ($path) { $this->imgPath = $path; } public function getHec () { $size = getimagesize($this->imgPath); $res = imagecreatefrompng($this->imgPath); for ($i = 0; $i < $size[1]; ++ $i) { for ($j = 0; $j < $size[0]; ++ $j) { $rgb = imagecolorat($res, $j, $i); $rgbarray = imagecolorsforindex($res, $rgb); if ($rgbarray['red'] < 125 || $rgbarray['green'] < 125 || $rgbarray['blue'] < 125) { $data[$i][$j] = 1; } else { $data[$i][$j] = 0; } } } $this->imgSize = $size; $this->hecData = $data; } public function magHorData () { $data = $this->hecData; $size = $this->imgSize; $z = 0; for ($i = 0; $i < $size[1]; ++ $i) { if (in_array('1', $data[$i])) { $z ++; for ($j = 0; $j < $size[0]; ++ $j) { if ($data[$i][$j] == '1') { $newdata[$z][$j] = 1; } else { $newdata[$z][$j] = 0; } } } } return $this->horData = $newdata; } public function showPhone ($ndatas) { error_reporting(0); $phone = null; $d = 0; foreach ($ndatas as $key => $val) { if (in_array(1, $val)) { foreach ($val as $k => $v) { $ndArr[$d] .= $v; } } if (! in_array(1, $val)) { $d ++; } } foreach ($ndArr as $key01 => $val01) { $phone .= $this->initData($val01); } return $phone; } /** * 初始数据 */ public function initData ($numStr) { $result = null; $data = array( '1' => '00000000111000000000000001110000000001001000100000000010100011000000000011000110000000000110000100000000010110011000000', '5' => '00000000001000000000000000010000000000100100100000000000101001110000000000100000110000000011000000100000001101000010000', '10' => '00000011100011100000000011001100100100100010010001000110000100100010001100001001000100011000010010001001001001100010100' ); foreach ($data as $key => $val) { similar_text($numStr, $val, $pre); if ($pre > 95) { // 相似度95%以上 $result = $key; break; } } return $result; } } $imgurl = 'jd.png'; list ($width, $heght, $type, $attr) = getimagesize($imgurl); $new_w = 17; $new_h = 11; $thisimage = imagecreatetruecolor($new_w, $new_h); // $new_w, $new_h 为裁剪后的图片宽高 $background = imagecolorallocate($thisimage, 255, 255, 255); imagefilledrectangle($thisimage, 0, 0, $new_w, $new_h, $background); $oldimg = imagecreatefrompng($imgurl); // 载入原始图片 // 首先定位要取图的位置(这里可以通过前端js或者其他手段定位,由于我这是测试,所以就ps定位并写死了) $weizhi = array( '1' => 165, '5' => 308, '10' => 456 ); foreach ($weizhi as $wwzz) { $src_y = 108; imagecopy($thisimage, $oldimg, 0, 0, $wwzz, $src_y, $new_w, $new_h); // $src_y,$new_w为原图中裁剪区域的左上角坐标拷贝图像的一部分将src_im图像中坐标从src_x,src_y开始,宽度为src_w,高度为src_h的一部分拷贝到dst_im图像中坐标为dst_x和dst_y的位置上。 $tem_png = 'tem_1.png'; imagepng($thisimage, __DIR__ . '/' . $tem_png); // 通过定位从原图中copy出想要识别的位置并生成新的缓存图,用以后面的图像识别类使用。 $gjPhone = new gjPhone($tem_png); // 实例化类 $gjPhone->getHec(); // 进行图像像素分离 $horData = $gjPhone->magHorData(); // 将分离出是数据转成01表示的图像、这里可以根据自己喜好定 $phone = $gjPhone->showPhone($horData); // 将转换好的01表示的数据与库中的数据进行匹配,匹配度95以上就算成功,库这里由于是做测试就直接写了数组 echo '| ' . $phone . ' | '; }

如此看来,其实12306验证码被破解也算是有情可原了,也没必要那么的口诛笔伐了罢。只要不断的抓验证码图片并转成自己程序可读的数据存入库里,然后验证的时候进行匹配就可以了。那么阿里的人脸识别支付原理也算是理解了,只不过他们做的可能会很精细。

前端时间有看到阿里云的一个验证码形式,刚开始感觉可能会好点,现在看来,只要有心,其实也是可以破解的啊。

好了,下面是原作代码。

/** * 电话号码识别. * @author by zsc for 2010.03.24 */ class gjPhone { protected $imgPath; // 图片路径 protected $imgSize; // 图片大小 protected $hecData; // 分离后数组 protected $horData; // 横向整理的数据 protected $verData; // 纵向整理的数据 function __construct ($path) { $this->imgPath = $path; } /** * 颜色分离转换... * * @param unknown_type $path * @return unknown */ public function getHec () { $size = getimagesize($this->imgPath); $res = imagecreatefrompng($this->imgPath); for ($i = 0; $i < $size[1]; ++ $i) { for ($j = 0; $j < $size[0]; ++ $j) { $rgb = imagecolorat($res, $j, $i); $rgbarray = imagecolorsforindex($res, $rgb); if ($rgbarray['red'] < 125 || $rgbarray['green'] < 125 || $rgbarray['blue'] < 125) { $data[$i][$j] = 1; } else { $data[$i][$j] = 0; } } } $this->imgSize = $size; $this->hecData = $data; } /** * 颜色分离后的数据横向整理... * * @return unknown */ public function magHorData () { $data = $this->hecData; $size = $this->imgSize; $z = 0; for ($i = 0; $i < $size[1]; ++ $i) { if (in_array('1', $data[$i])) { $z ++; for ($j = 0; $j < $size[0]; ++ $j) { if ($data[$i][$j] == '1') { $newdata[$z][$j] = 1; } else { $newdata[$z][$j] = 0; } } } } return $this->horData = $newdata; } /** * 整理纵向数据... * * @return unknown */ public function magVerData ($newdata) { for ($i = 0; $i < 132; ++ $i) { for ($j = 1; $j < 13; ++ $j) { $ndata[$i][$j] = $newdata[$j][$i]; } } $sum = count($ndata); $c = 0; for ($a = 0; $a < $sum; $a ++) { $value = $ndata[$a]; if (in_array(1, $value)) { $ndatas[$c] = $value; $c ++; } elseif (is_array($ndatas)) { $b = $c - 1; if (in_array(1, $ndatas[$b])) { $ndatas[$c] = $value; $c ++; } } } return $this->verData = $ndatas; } /** * 显示电话号码... * * @return unknown */ public function showPhone ($ndatas) { $phone = null; $d = 0; foreach ($ndatas as $key => $val) { if (in_array(1, $val)) { foreach ($val as $k => $v) { $ndArr[$d] .= $v; } } if (! in_array(1, $val)) { $d ++; } } foreach ($ndArr as $key01 => $val01) { $phone .= $this->initData($val01); } return $phone; } /** * 分离显示... * * @param unknown_type $dataArr */ function drawWH ($dataArr) { if (is_array($dataArr)) { foreach ($dataArr as $key => $val) { foreach ($val as $k => $v) { if ($v == 0) { $c .= "<font color='#FFFFFF'>" . $v . "</font>"; } else { $c .= $v; } } $c .= "<br/>"; } } echo $c; } /** * 初始数据... * * @param unknown_type $numStr * @return unknown */ public function initData ($numStr) { $result = null; $data = array( 0 => '000011111000001111111110011000000011110000000001110000000001110000000001110000000001011000000011011100000111000111111100000001110000', 1 => '011000000000011000000000111111111111111111111111', 2 => '001000000011011000000111110000001101110000011001110000011001110000110001111001100001011111100001000110000001', 3 => '001000000010011000000011110000000001110000000001110000110001110000110001011001110011011111011111000110001100', 4 => '000000001100000000111100000001111100000011101100000111001100001100001100011000001100111111111111111111111111000000001100000000000100', 5 => '111111000001111111000001110001000001110001000001110001100001110001100001110000110011110000111111000000001100', 6 => '000011111000001111111110011000110011110001100001110001100001110001100001110001100001010001110011010000111111000000001100', 7 => '110000000000110000000111110000111111110001110000110111000000111100000000111000000000111000000000', 8 => '000100011110011111111111110011100001110001100001110001100001110001100001110011100001011111111111000100011110', 9 => '001111000000011111100001110000110001110000110001110000110001110000110001011000100001011111100111000111111110000001110000' ); foreach ($data as $key => $val) { similar_text($numStr, $val, $pre); if ($pre > 95) { // 相似度95%以上 $result = $key; break; } } return $result; } } $imgPath = "http://bj.ganji.com/tel/5463013757650d6c5e31093e563c51315b6c5c6c5237.png"; $gjPhone = new gjPhone($imgPath); // 进行颜色分离 $gjPhone->getHec(); // 画出横向数据 $horData = $gjPhone->magHorData(); echo "===============横向数据==============<br/><br/><br/>"; $gjPhone->drawWH($horData); // 画出纵向数据 $verData = $gjPhone->magVerData($horData); echo "<br/><br/><br/>===============纵向数据==============< br/><br/><br/>"; $gjPhone->drawWH($verData); // 输出电话 $phone = $gjPhone->showPhone($verData); echo "<br/><br/><br/>===============电话==============<br /><br/><br/>" . $phone;

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

时间: 2024-09-27 05:19:20

PHP图像识别技术原理与实现的相关文章

PHP图像识别技术原理与实现_php实例

其实图像识别技术与我们平时做的密码验证之类的没有什么区别,都是事先把要校验的数据入库,然后使用时将录入(识别)的数据与库中的数据做对比,只不过图像识别技术有一部分的容错性,而我们平时的密码验证是要100%匹配. 前几天,有朋友谈到做游戏点击抽奖,识别图片中的文字,当时立马想到的就是js控制或者flash做遮罩层,感觉这种办法是最方便快捷效果好,而且节省服务器资源,但是那边提的要求竟然是通过php识别图像中的文字. 赶巧那两天的新闻有:1.马云人脸识别支付:2.12306使用新的验证码,说什么现在

图像识别技术在安防领域的应用研究

图像识别技术是实现摄像机从看清到看懂质的飞跃.在安防视频监控领域,图像识别技术结合行业视频业务的应用,有效地提高了公安.交通.司法.零售等行业的效率,让感知型摄像机实现了高附加值的市场定位. 文/叶霞苏州科达科技股份有限公司新媒体营销总监 近一两年来,人工智能领域得到了媒体界.产业界和学术界等前所未有的关注,机器正在越来越多的取代人类特有的优势和技能,这其中最为重要的可能就是图像识别技术.本文将从图像识别技术的原理阐述出发,介绍这一技术在安防行业的具体应用,并且阐述其在当前安防应用上碰到的困难.

解析:整容式的美颜2.0技术如何实现?聊一聊背后的图像识别技术

雷锋网按:本文根据涂图CTO在七牛云架构师沙龙上的演讲整理,本篇主要谈谈人脸识别技术的原理与具体实践的一些问题,作者授权发布雷锋网(公众号:雷锋网). 在上篇文章的最后,我们提到了美颜2.0最关键的技术--人脸识别.这是项复杂但又非常热门的技术,我们将在这篇文章中聊一聊图像识别技术. 一.如何让机器看懂世界? 这里我们来简单聊聊机器学习与深度学习. 近段时间,机器学习.深度学习的概念非常火,尤其是今年 AlphaGo 击败了韩国棋手这件事,引起了世界的轰动.机器学习和深度学习这两个概念,比较容易

AI+时代,谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生趣,即产品一般般,也即产品经理做了功能经理.产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品,产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论.AI+时代图片识别技术就是起点! 撰写本篇的目的: 当下每天看的到一个词:AI,满眼皆是AI的阶段,我们产品经理应该如何了解到AI的技术脉络和市场需求大势.AI不是新的概念,再次起来是因为有新的突破. 创新工场的李开复博士说现在是技术

PHP 伪静态技术原理以及突破原理实现介绍

伪静态技术比较好突破,需要自己构造中转注入页面:伪静态技术原理都很简单,就是把原来的 index.php?id=1 这种形式的URL给替换成其它形式   先说实现方法: inj.php: 复制代码 代码如下: <?php set_time_limit(10); $id=$_GET["id"]; $id=str_replace(" ","%20",$id); $id=str_replace("=","%3D&qu

图像识别技术“一眼”看出你有多疼

  据外媒报道,对于疼痛,人们往往只能用模糊描述.最近,加州大学圣地亚哥分校研究出一种电脑图像识别算法,可以通过分析患者的面部表情测量出疼痛等级. 图像识别技术"一眼"看出你有多疼(图片来自新浪) 据介绍,如果你龇牙咧嘴,那么你的疼痛感应该比紧锁眉头要更强一些.他可能没有了解你的父母懂得"疼在你身,痛在我心",但是应该能比过与你素不相识的护士小姐. 这项技术并非纸上谈兵,它的确有实用价值.护士可借此判断你在外科手术时是否注射了足量的麻醉剂.这项拘束很像电影<超

用图像识别技术将Instagram 变成可购物的市场 Geenee 完成440万美元A轮融资

用户在 Instagram 平台上获取的内容服务和他们在网上购物之间存在脱节,为了弥补 Instagram这方面的空白,影响者利用 RewardStyle 和 Geenee 等 app 增加图片的营利性. 昨天(12月1日),图片识别工具 Geenee 完成 440 万美元 A 轮融资,投资方有 Highlight Communications AG.Constantin Media AG 以及 Stephen Cohen 和 Steve Titus . Geenee 平台可以帮助用户在 Ins

&quot;爱说说&quot;技术原理:与TXT交互及MDataTable对Json的功能扩展(二)

关于爱说说在技术选型的文章见:"爱说说"技术原理方案的定选思考过程   本篇将讲述"爱说说"比较重大的技术问题点及解决手段:   爱说说:http://speak.cyqdata.com/   杂说几句: 一开始,原本是打算在秋式开源团队找一JS人才来引导前台页面的呈现的,毕竟本人在JS还停留在原始的编码阶段,于是当时聊了一下. 再后来,接下来几天,由于秋式开源团队内部管理上有点小调整,还有新开任务小组的事,连续忙了几天,"爱说说"就也停了几天.

《工业控制网络安全技术与实践》一一2.5 PLC设备的技术原理

2.5 PLC设备的技术原理 前面简单介绍了PLC的基本概念.应用领域和特点,本节将详细介绍PLC设备的产生与特点.基本组成.工作原理及其使用的指令系统.通信技术和接口技术.2.5.1 PLC的产生与特点 在可编程逻辑控制器问世之前,继电器控制在工业控制领域占主导地位.继电器控制系统采用固定接线的硬件实现控制逻辑.如果生产任务或工艺发生变化,就必须重新设计和改变硬件结构,这样就会造成时间和资金的浪费.另外,大型控制系统用继电器.接触器控制,使用的继电器数量多.体积大.耗电多,且继电器触点为机械触