图像处理------理解卷积

一：什么是卷积

离散卷积的数学公式可以表示为如下形式：

f(x) = - 其中C(k)代表卷积操作数，g(i)代表样本数据, f(x)代表输出结果。

举例如下：

假设g(i)是一个一维的函数，而且代表的样本数为G = [1,2,3,4,5,6,7,8,9]

假设C(k)是一个一维的卷积操作数, 操作数为C=[-1,0,1]

则输出结果f(x)可以表示为 F=[1,2,2,2,2,2,2,2,1] //边界数据未处理

以上只是一维的情况下，当对一幅二维数字图像加以卷积时，其数学意义可以解释如下：

源图像是作为输入源数据，处理以后要的图像是卷积输出结果，卷积操作数作为Filter

在XY两个方向上对源图像的每个像素点实施卷积操作。如图所示：

粉红色的方格每次在X/Y前进一个像素方格，就会产生一个新的输出像素，图中深蓝色的代

表要输出的像素方格，走完全部的像素方格，就得到了所有输出像素。

图中，粉红色的矩阵表示卷积操作数矩阵，黑色表示源图像– 每个方格代表一个像素点。

二：卷积在数字图像处理中应用

一副数字图像可以看作一个二维空间的离散函数可以表示为f(x, y), 假设有对于二维卷积操

作函数C(u, v) ，则会产生输出图像g(x, y) = f(x, y) *C(u,v), 利用卷积可以实现对图像模糊处理，边缘检测，产生轧花效果的图像。

一个简单的数字图像卷积处理流程可以如下：

1. 读取源图像像素

2. 应用卷积操作数矩阵产生目标图像

3. 对目标图像进行归一化处理

4. 处理边界像素

三：一个纯Java的卷积模糊图像效果

四：关键代码解释

完成对像素点RGB颜色的卷积计算代码如下：

// red color

out3DData[row][col][1] =in3DData[row][col][1] +

in3DData[row-1][col][1] +

in3DData[row+1][col][1] +

in3DData[row][col-1][1] +

in3DData[row-1][col-1][1] +

in3DData[row+1][col-1][1] +

in3DData[row][col+1][1] +

in3DData[row-1][col+1][1] +

in3DData[row+1][col+1][1];

// green color

out3DData[row][col][2] =in3DData[row][col][2] +

in3DData[row-1][col][2] +

in3DData[row+1][col][2] +

in3DData[row][col-1][2] +

in3DData[row-1][col-1][2] +

in3DData[row+1][col-1][2] +

in3DData[row][col+1][2] +

in3DData[row-1][col+1][2] +

in3DData[row+1][col+1][2];

// blue color

out3DData[row][col][3] =in3DData[row][col][3] +

in3DData[row-1][col][3] +

in3DData[row+1][col][3] +

in3DData[row][col-1][3] +

in3DData[row-1][col-1][3] +

in3DData[row+1][col-1][3] +

in3DData[row][col+1][3] +

in3DData[row-1][col+1][3] +

in3DData[row+1][col+1][3];

计算归一化因子以及对卷积结果归一化处理的代码如下：

// find the peak data frominput and output pixel data.

int inpeak = 0;

int outPeak = 0;

for(int row=0; row<srcH; row++) {

for(int col=0; col<srcW; col++) {

if(inpeak < in3DData[row][col][1]) {

inpeak = in3DData[row][col][1];

}

if(inpeak < in3DData[row][col][2]) {

inpeak = in3DData[row][col][2];

}

if(inpeak < in3DData[row][col][3]) {

inpeak = in3DData[row][col][3];

}

if(outPeak < out3DData[row][col][1]) {

outPeak = out3DData[row][col][1];

}

if(outPeak < out3DData[row][col][2]) {

outPeak = out3DData[row][col][2];

}

if(outPeak < out3DData[row][col][3]) {

outPeak = out3DData[row][col][3];

}

// normalization

double outputScale = ((double) inpeak) / ((double)outPeak);

for(int row=0; row<srcH; row++) {

for(int col=0; col<srcW; col++) {

out3DData[row][col][1] = (int)(outputScale * out3DData[row][col][1]);

out3DData[row][col][2] = (int)(outputScale * out3DData[row][col][2]);

out3DData[row][col][3] = (int)(outputScale * out3DData[row][col][3]);

}

五：本文没有提及的内容 –边界像素处理

没有处理边缘像素，对边缘像素的处理，有两个可以参考的方法

其一是直接填充法– 超出边界部分的以边界像素填充。

其二是线性插值法– 超出边界部分的以 i/row的像素填充。

时间： 2024-12-03 16:35:27

图像处理------理解卷积的相关文章

Top100论文导读：深入理解卷积神经网络CNN（Part Ⅰ）

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者信息 Adrian Colyer:morning paper编辑.Accel Partners投资合伙人.SpringSource首席技术官.VMware技术总监. 领英:http://www.linkedin.com/in/adriancolyer/ Twitter:https://twitter.com/adriancolyer 本文介绍清单" Top100深度学习论文" 中几篇文章,现在将从&quo

图像处理------应用卷积一实现噪声消去

均值滤波: 均值滤波,是图像处理中最常用的手段,从频率域观点来看均值滤波是一种低通滤波器,高频信号将会去掉,因此可以帮助消除图像尖锐噪声,实现图像平滑,模糊等功能.理想的均值滤波是用每个像素和它周围像素计算出来的平均值替换图像中每个像素.采样Kernel数据通常是3X3的矩阵,如下表示: 从左到右从上到下计算图像中的每个像素,最终得到处理后的图像.均值滤波可以加上两个参数,即迭代次数,Kernel数据大小.一个相同的Kernel,但是多次迭代就会效果越来越好. 同样,迭代次数相同,Ker

Top100论文导读：深入理解卷积神经网络CNN（Part Ⅱ）

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者信息 Adrian Colyer:morning paper编辑.Accel Partners投资合伙人.SpringSource首席技术官.VMware技术总监. 领英:http://www.linkedin.com/in/adriancolyer/ Twitter:https://twitter.com/adriancolyer 这篇文章介绍" top100深度学习论文"列表中卷积神经网络的第二部分,

图像处理------高斯模糊

高斯模糊是一种两维的卷积模糊操作,在图像完成高斯模糊相对于均值模糊来说, 计算量会增加,但是高斯模糊可以实现一些特殊效果,特别是在图像噪声(非椒盐噪声)消去方面,更是有着非常好的效果.一维高斯公式如下: 其中x是制定[-n,n]范围的整数,sigma代表标准方差.通常取值为1. 一维高斯函数Java代码如下: [java] view plaincopy private float[] get1DKernalData(int n, float sigma) { float sigma

卷积神经网络算法的简单实现

前言从理解卷积神经到实现它,前后花了一个月时间,现在也还有一些地方没有理解透彻,CNN还是有一定难度的,不是看哪个的博客和一两篇论文就明白了,主要还是靠自己去专研,阅读推荐列表在末尾的参考文献.目前实现的CNN在MINIT数据集上效果还不错,但是还有一些bug,因为最近比较忙,先把之前做的总结一下,以后再继续优化. 卷积神经网络CNN是Deep Learning的一个重要算法,在很多应用上表现出卓越的效果,[1]中对比多重算法在文档字符识别的效果,结论是CNN优于其他所有的算法.CNN在手写体

卷积的物理意义

卷积是"信号与系统"中论述系统对输入信号的响应而提出的.因为是对模拟信号论述的,所以常常带有繁琐的算术推倒,很简单的问题的本质常常就被一大堆公式淹没了,那么卷积究竟物理意义怎么样呢? 卷积表示为y(n) = x(n)*h(n) 使用离散数列来理解卷积会更形象一点,我们把y(n)的序列表示成y(0),y(1),y(2) and so on; 这是系统响应出来的信号. 同理,x(n)的对应时刻的序列为x(0),x(1),x(2)...and so on; 其实我们如果没有学过信号与系统,就

28款GitHub最流行的开源机器学习项目（一）：TensorFlow排榜首

1. TensorFlow TensorFlow 是谷歌发布的第二代机器学习系统.据谷歌宣称,在部分基准测试中,TensorFlow的处理速度比第一代的DistBelief加快了2倍之多. 具体的讲,TensorFlow是一个利用数据流图(Data Flow Graphs)进行数值计算的开源软件库:图中的节点( Nodes)代表数学运算操作,同时图中的边(Edges)表示节点之间相互流通的多维数组,即张量(Tensors).这种灵活的架构可以让使用者在多样化的将计算部署在台式机.服务器或者移动设

十分钟看懂图像语义分割技术

大多数人接触 "语义" 都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在 "语义" 的. 今天是 AI 大热年,很多人都关注与机器人的语音交互,可是有没有想过,将来的机器人如果不能通过图像来识别主人,家里的物品.宠物,那该多没意思.说近一些,假如扫地机器人能够机智地绕开你丢在地上的臭袜子而扫走旁边的纸屑,一定能为你的生活解决不少麻烦. 没错,图像语义分割是 AI

深度学习必备手册（上）

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 请收下这份关于人工智能的根目录--博客整理系列(一) 关于数据科学的那些事--博客整理系列(二) 机器学习必备手册--博客整理系列(三) 扩展眼界的都在这--博客整理系列(四) 深度学习必备手册--博客整理系列(六) 深度学习的概念源于人工神经网络的研究,如果追溯深度学习的概念还是要回到2006年Hinton那篇论文,基于深信度网(DNB)提出非监督贪心逐层训练算法,未解决深层结构相关的优化难题出现的论文.