利用OpenCV检测图像中的长方形画布或纸张并提取图像内容

原文:利用OpenCV检测图像中的长方形画布或纸张并提取图像内容

基于知乎上的一个答案。问题如下:

也就是在一张照片里,已知有个长方形的物体,但是经过了透视投影,已经不再是规则的长方形,那么如何提取这个图形里的内容呢?这是个很常见的场景,比如在博物馆里看到一幅很喜欢的画,用手机找了下来,可是回家一看歪歪斜斜,脑补原画内容又觉得不对,那么就需要算法辅助来从原图里提取原来的内容了。不妨把应用的场景分为以下:

纸张四角的坐标(图中红点)已知的情况

也就是上面的左图中4个红点是可以准确获取,比如手动标注,那么就简单了:用OpenCV的Perspective Transform就可以。具体步骤如下:

1) 将标注好的四个点坐标存入一个叫corner的变量里,比如上面的例子中,原图的分辨率是300x400,定义x和y的方向如下:

那么纸张的四角对应的坐标分别是:

左上:157.6, 71.5

右上:295.6, 118.4

 

右下:172.4, 311.3

 

左下:2.4, 202.4

 

把这四个坐标按如上顺序放到一个叫corner的变量里。如果我们打算把这幅图案恢复到一个300x400的图像里,那么按照对应的顺序把下面四个坐标放到一个叫canvas的变量里:

左上:0, 0

右上:300, 0

右下:300, 400

 

左下:0, 400

 

假设原图已经用OpenCV读取到一个叫image的变量里,那么提取纸张图案的代码如下:

1 M = cv2.getPerspectiveTransform(corners, canvas)
2 result = cv2.warpPerspective(image, M, (0, 0))

把左图剪裁出来,去掉红点后试了试,结果如下:

当然,其实这一步用Photoshop就可以了。。

纸张四角的坐标未知或难以准确标注的情况

这种场景可能是小屏幕应用,或是原始图像就很小,比如我这里用的这个300x400例子,点坐标很难精确标注。这种情况下一个思路是,用边缘检测提取纸张四边,然后求出四角坐标,再做Perspective Transform。

 

1) 图像预处理

一般而言即使做普通的边缘检测也需要提前对图像进行降噪避免误测,比如最常见的办法是先对图像进行高斯滤波,然而这样也会导致图像变得模糊,当待检测图形边缘不明显,或是图像本身分辨率不高的情况下(比如本文用的例子),会在降噪的同时把待检测的边缘强度也给牺牲了。具体到本文的例子,纸张是白色,背景是浅黄带纹路,如果进行高斯滤波是显然不行的,这时候一个替代方案是可以考虑使用Mean Shift,Mean Shift的优点就在于如果是像背景桌面的浅色纹理,图像分割的过程中相当于将这些小的浮动过滤掉,并且保留相对明显的纸张边缘,结果如下:

原图

处理后

Meanshift的代码:

1 image = cv2.pyrMeanShiftFiltering(image, 25, 10)

因为主要目的是预处理降噪,windows size和color distance都不用太大,避免浪费计算时间还有过度降噪。降噪后可以看到桌面上的纹理都被抹去了,纸张边缘附近干净了很多。然而这还远远不够,图案本身,和图像里的其他物体都有很多明显的边缘,而且都是直线边缘。

2) 纸张边缘检测

虽然降噪了,可是图像里还是有很多边缘明显的元素。怎么尽量只保留纸张的边缘呢,这时候可以考虑用分割算法,把图像分为纸张部分和其他部分,这样分割的mask边缘就和纸张边缘应该是差不多重合的。在这里可以考虑用GrabCut,这样对于简单的情况,比如纸张或画布和背景对比强烈的,直接把图像边缘的像素作为bounding box就可以实现自动分割。当自动分割不精确的情况下再引入手动辅助分割,具体到我这里用的例子,背景和画面接近,所以需要手动辅助:

结果如下:

可以看到,分割后的结果虽然能基本区分纸张形状了,可是边缘并不准确,另外键盘和部分桌面没能区分开来。这时可以继续用GrabCut+手动标注得到只有纸张的分割。或者为了用户友好的话,尽量少引入手动辅助,那么可以考虑先继续到下一步检测边缘,再做后期处理。假设我们考虑后者,那么我们得到的是如下的mask:

这个mask并不精确,所以不能直接用于边缘检测,但是它大致标出了图片里最明显的边缘位置所在,所以可以考虑下面的思路:保留降噪后位于mask边缘附近的信息用于真正的边缘检测,而把其他部分都模糊处理,也就是说基于上面得到的mask做出下面的mask用于模糊处理:

基于这个mask得到的用于边缘检测的图像如下:

用canny算子检测出边缘如下:

3) 直线检测

对检测到的边缘使用Hough变换检测直线,我例子里用的是cv2.HoughLinesP,分辨率1像素和1°,可以根据图像大小设置检测的阈值和minLineLength去除大部分误检测。特别提一下的是如果使用OpenCV的Python binding,OpenCV 2和OpenCV 3的结果结构是不一样的,如果进行代码移植需要相应的修改。检测到的结果如下:

可以看到,有些线几乎重合在一起了,这是难以避免的,上图中一共检测到9条线,其中两对(下、右边缘)重合。可以通过距离判断和直线相对角度来判断并把重合线段合为一条:

剩下的都是没有重合的线了。

4) 判断纸张边缘

那么如何选取纸张边缘的四条线呢(即使图像分割步骤非常好得分开了纸张和其他部分,这在有些情况下还是难以避免的,比如图案里有和边缘平行的线条),可以沿着提取线段的两边采样像素的灰度:

在线段的两个端点之间平均采样左右两边像素的值,因为一般来说如果是纸张或者画布,边缘和背景的颜色在四边上应该都是类似的。然而这样做的话引入另外一个问题是需要区分线段的“左”和“右”,对于线段本身而言就是要区分前后。所以需要对画面里所有的线段端点进行排序,而这个排序的基准就是相对画布。

具体到本文的例子就是把图像中心定义为所有线段的“左”边,如上图。而决定线段端点“前”和“后”可以用如下办法:

先假设线段的前后端点,将两个端点坐标分别减去中心点(红点)的坐标,然后将得到的两个向量a和b求叉积,如果叉积大于0则说明假设正确,如果<0则交换假设的前后端点。线段端点的顺序确定后就可以进行采样了,简单起见可以分别采样左右两侧的像素灰度值,如果希望更准确可以采样RGB通道的值进行综合比较,下面是7条线段对应的两侧像素灰度的中值分布:

可以看到其中有4个点距离非常近(红色),说明他们的像素灰度分布也很接近,把这4条选出来,结果如下:

正是要的结果。

5) 计算四角的坐标

接下来计算四条线的交点,方法点这里。因为有4条线,会得到6个结果,因为在这种应用场景中,方形的物体在透视变换下不会出现凹角,所以直接舍弃离纸张中心最远的两个交点就得到了四个角的坐标,结果如下:

这样就回到了一开始四角坐标已经得到的情况,直接进行透视变换就行了。

Camera Calibration?

写了这么多,其实有一条至关重要的假设,甚至可以说是最关键的步骤之一我一直没提,那就是Camera Calibration,如果有相机的情况下,meta data都知道,那么需要先坐Camera Calibration才能知道纸张或者画布的原始尺寸。我这里试的例子当然是没有的,也可以有,相应的算法OpenCV里也有现成的,但准确度未必够,而且还是非常麻烦,所以我的所有流程都是默认原始尺寸已经获得了。再说了,就算没有,变换回方形之后使用者凭感觉进行简单轴缩放都比Camera Calibration方便得多。。

印象派

我用的例子算是略微有些极端的,因为背景和图案非常接近,另一方面分辨率还巨低。在网上搜搜,我找了幅少年画家的印象派作品来试试:

原图

手动标注

GrabCut

检测到的边缘

结果

看上去还不错~

时间: 2024-09-26 20:01:05

利用OpenCV检测图像中的长方形画布或纸张并提取图像内容的相关文章

《Adobe Photoshop CS5中文版经典教程(全彩版)》—第2课2.6节替换图像中的颜色

2.6 替换图像中的颜色Adobe Photoshop CS5中文版经典教程(全彩版)通过使用颜色替换工具进行绘画,可将一种颜色替换为另一种颜色.当您开始使用颜色替换工具进行绘画时,它将对当前颜色进行分析,随后只替换类似的颜色,因此不要求您绘画时非常精确.可通过设置指定被替换的颜色是否连续以及它们的相似程度. 下面使用颜色替换工具修改运动场图像中女孩帽子的颜色. 1.放大图像以便能够清晰地看到女孩的帽子. 2.在工具箱中,选择隐藏在画笔工具(图片 52)后面的颜色替换工具(图片 55). 3.单

如何利用opencv实现在视频中每隔固定的n像素列数取一副图像?

问题描述 如何利用opencv实现在视频中每隔固定的n像素列数取一副图像? 在视频中,视频向前播放,视频画面每隔固定的像素列数n后,取当前的画面.各位大神有没有思路? 解决方案 视频不是以帧的形式播放的吗?那怎么实现你这种方法哦.除非你的n个列数就是一幅图像列数

opencv 区域检测-如何利用opencv对ycbcr格式的图像求重心

问题描述 如何利用opencv对ycbcr格式的图像求重心 如题,在opencv中将普通格式的图像转化为ycbcr用以检测肤色后,如何对图像求重心?是利用cvmoments吗?但是这个函数好像只能用于二值化图像,程序运行到一半会报错求大神解答 解决方案 利用opencv求图像重心 解决方案二: 重心这种计算,一般都是针对二值图或者单通道进行的,你可以对Y通道进行二值化,然后再计算重心!还有,计算重心的算法很简单,没必要非要用opencv,自己写一个都可以! 解决方案三: 一般某个核心的研究成果,

通过图像处理检测图像中的印刷品是否展平

问题描述 通过图像处理检测图像中的印刷品是否展平 针对一幅图像,利用图像处理算法检测图像中的印刷品是否展平,哪里出现变形?求指导

c++-利用OpenCV比较图像旋转角度

问题描述 利用OpenCV比较图像旋转角度 有两个图,已经加载到Mat中,期中的一个图是另一个图经过一定的旋转得到的,我想利用OpenCV来获得被旋转图是旋转了多少度.希望各位大虾能给点思路或者方法,谢谢了! 解决方案 不知道我说的符不符合你的情况哈 . 我这边以前也弄过图片旋转, 一张图片经过旋转后,再保存就会发现它的 width 跟height不一样的 , 一般是变大,比如旋转九十度,那么它的宽就成了高了,旋转的角度与宽高变化的关系可以用数学式子整理出来.不知道用在你那上面对不对了 .这只是

怎样实现c++利用opencv实现人脸检测与识别

问题描述 怎样实现c++利用opencv实现人脸检测与识别 就是指通过摄像头保存识别的人脸,再次识别时如果被识别的人是已经添加图片的,就把他的名字显示出来,如果没有就将人脸保存.求大神,提前谢谢. 解决方案 这你需要机器学习才能够实现. 具体学习方法可以用BOOSTING算法,随机森林算法或者K邻近算法,具体代码可以从<学习OPENCV>中找到,若是不想自己敲代码,也可以在百度中区找.其实OPENCV的sample里也有相关的代码.不过你自己需要建立自己的数据库.

【OpenCV】访问图像中每个像素的值 (I)

最近要做的东西要对每个像素值进行处理,所以上网搜... 居然发现搜出来的好文章都是一个人写的,而且还是一个妹子..于是收藏之...按时间顺序发! 转载请注明出处:http://blog.csdn.net/xiaowei_cqu/article/details/7557063 !!此篇是基于IplImage* (C接口或者说2.1之前版本的接口,新的Mat的访问方式请参考博文: <访问Mat图像中每个像素的值>) IplImage是OpenCV中CxCore部分基础的数据结构,用来表示图像,其中

【OpenCV】访问Mat图像中每个像素的值 (II)

今天百度搜资料还搜到了自己的...<访问图像中每个像素的值>,这是之前写的了,用的也是2.0的风格IplImage*格式,不太适用后来Mat的格式,特此重写一篇. 以下例子源自<The OpenCV Tutorials --Release 2.4.2>2.2 How to scan images, lookup tables and time measurement with OpenCV 图像容器Mat 还是先看Mat的存储形式.Mat和Matlab里的数组格式有点像,但一般是二

在vs2010中如何利用opencv使用“打开文件”选择路径读取视频信息

问题描述 在vs2010中如何利用opencv使用"打开文件"选择路径读取视频信息 代码如下,在网上找了好多都是使用绝对路径才能读取视频信息,我想用"打开文件"取得的文件路径,利用cvCaptureFromAVI读取视频应该怎么处理?或者可以用opencv提供的其他函数来读取视频的相关信息吗? 以下代码的错误提示:"cvCreateFileCapture": 不能将参数 1 从"CString"转换为"const c