视频图像处理基础知识0(双线性插值算法进行图像缩放)【转】

转自:http://blog.csdn.net/times_poem/article/details/51395781

版权声明:本文为博主原创文章,未经博主允许不得转载。

目录(?)[-]

  1. 双线性插值说的很明白
  2. 双线性插值算法进行图像缩放及性能效果优化

 

双线性插值(说的很明白)

来自:http://www.cnblogs.com/linkr/p/3630902.html

        http://www.cnblogs.com/linkr/p/3630902.html

双线性插值,这个名字咋一听很高大上的样纸,再在维基百科上一查(见文末,我去,一堆的公式吓死人),像俺这种半文盲,看到公式脑子就懵的类型,真心给跪。虽然看着好复杂,但仔细一看道理再简单不过了,所以还是自己梳理一下好。

双线性插值,顾名思义就是两个方向的线性插值加起来(这解释过于简单粗暴,哈哈)。所以只要了解什么是线性插值,分别在x轴和y轴都做一遍,就是双线性插值了。

线性插值的概念也非常简单粗暴,就是两个点A,B,要在AB中间插入一个点C(点C坐标在AB连线上),就直接让C的值落在AB的值的连线上就可以了。

如A点坐标(0,0),值为3,B点坐标(0,2),值为5,那要对坐标为(0,1)的点C进行插值,就让C落在AB线上,值为4就可以了。

但是如果C不在AB的线上肿么办捏,所以就有了双线性插值。如图,已知Q12,Q22,Q11,Q21,但是要插值的点为P点,这就要用双线性插值了,首先在x轴方向上,对R1和R2两个点进行插值,这个很简单,然后根据R1和R2对P点进行插值,这就是所谓的双线性插值。

 

附:维基百科--双线性插值:

双线性插值,又称为双线性内插。在数学上,双线性插值是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。

假如我们想得到未知函数  在点  的值,假设我们已知函数  在 ,
及  四个点的值。

首先在 x 方向进行线性插值,得到

然后在 y 方向进行线性插值,得到

这样就得到所要的结果 ,

如果选择一个坐标系统使得  的四个已知点坐标分别为 (0, 0)、(0, 1)、(1, 0) 和 (1, 1),那么插值公式就可以化简为

或者用矩阵运算表示为

与这种插值方法名称不同的是,这种插值方法的结果通常不是线性的,它的形式是

常数的数目都对应于给定的 f 的数据点数目

线性插值的结果与插值的顺序无关。首先进行 y 方向的插值,然后进行 x 方向的插值,所得到的结果是一样的。

 

双线性插值算法进行图像缩放及性能效果优化

一)转自http://handspeaker.iteye.com/blog/1545126

最近在编程时用到了双线性插值算法,对图像进行缩放。网上有很多这方面的资料,介绍的也算明白。但是,这些文章只介绍了算法,并没有具体说怎么实现以及怎么实现最好,举个例子,你可以按照网上文章的算法自己写一个双线性插值程序,用它对一张图片进行处理,然后再用matlab或者OpenCV的resize函数对同一张图片进行处理,得到的结果是不一样的,如果源图片较小,效果差距就更大。以下是对于双线性插值的讲解以及上述现象的解释:

 

1.双线性插值

假设源图像大小为mxn,目标图像为axb。那么两幅图像的边长比分别为:m/a和n/b。注意,通常这个比例不是整数,编程存储的时候要用浮点型。目标图像的第(i,j)个像素点(i行j列)可以通过边长比对应回源图像。其对应坐标为(i*m/a,j*n/b)。

显然,这个对应坐标一般来说不是整数,而非整数的坐标是无法在图像这种离散数据上使用的。双线性插值通过寻找距离这个对应坐标最近的四个像素点,来计算该点的值(灰度值或者RGB值)。如果你的对应坐标是(2.5,4.5),那么最近的四个像素是(2,4)、(2,5)、(3,4),(3,5)。

若图像为灰度图像,那么(i,j)点的灰度值可以通过一下公式计算:

f(i,j)=w1*p1+w2*p2+w3*p3+w4*p4;

其中,pi(i=1,2,3,4)为最近的四个像素点,wi(i=1,2,3,4)为各点相应权值。关于权值的计算,在维基百科和百度百科上写的很明白。

 

2.存在的问题

这部分的前提是,你已经明白什么是双线性插值并且在给定源图像和目标图像尺寸的情况下,可以用笔计算出目标图像某个像素点的值。当然,最好的情况是你已经用某种语言实现了网上一大堆博客上原创或转载的双线性插值算法,然后发现计算出来的结果和matlab、opencv对应的resize()函数得到的结果完全不一样。

那这个究竟是怎么回事呢?

其实答案很简单,就是坐标系的选择问题,或者说源图像和目标图像之间的对应问题。

按照网上一些博客上写的,源图像和目标图像的原点(0,0)均选择左上角,然后根据插值公式计算目标图像每点像素,假设你需要将一幅5x5的图像缩小成3x3,那么源图像和目标图像各个像素之间的对应关系如下:

只画了一行,用做示意,从图中可以很明显的看到,如果选择右上角为原点(0,0),那么最右边和最下边的像素实际上并没有参与计算,而且目标图像的每个像素点计算出的灰度值也相对于源图像偏左偏上。

那么,让坐标加1或者选择右下角为原点怎么样呢?很不幸,还是一样的效果,不过这次得到的图像将偏右偏下。

最好的方法就是,两个图像的几何中心重合,并且目标图像的每个像素之间都是等间隔的,并且都和两边有一定的边距,这也是matlab和openCV的做法。如下图:

如果你不懂我上面说的什么,没关系,只要在计算对应坐标的时候改为以下公式即可,

 

int x=(i+0.5)*m/a-0.5

int y=(j+0.5)*n/b-0.5

 

instead of 

 

 

int x=i*m/a

int y=j*n/b

 

利用上述公式,将得到正确的双线性插值结果

总结:

总结一下,我得到的教训有这么几条。

1.网上的一些资料有的时候并不靠谱,自己还是要多做实验。

2.不要小瞧一些简单的、基本的算法,让你写你未必会写,而且其中可能还藏着一些玄妙。

3.要多动手编程,多体会算法,多看大牛写的源码(虽然有的时候很吃力,但是要坚持看)。

二)转自http://www.cnblogs.com/Imageshop/archive/2011/11/12/2246808.html

 在图像处理中,双线性插值算法的使用频率相当高,比如在图像的缩放中,在所有的扭曲算法中,都可以利用该算法改进处理的视觉效果。首先,我们看看该算法的简介。

     在数学上,双线性插值算法可以看成是两个变量间的线性插值的延伸。执行该过程的关键思路是先在一个方向上执行线性插值,然后再在另外一个方向上插值。下图示意出这个过程的大概意思。

     用一个简单的数学表达式可以表示如下:

     f(x,y)=f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy

     合并有关项,可写为: f(x,y)=(f(0,0)(1-x)+f(1,0)x) (1-y)+(f(0,1)(1-x)+f(1,1)x)y

     由上式可以看出,这个过程存在着大量的浮点数运算,对于图像这样大的计算用户来说,是一个较为耗时的过程。

     考虑到图像的特殊性,他的像素值的计算结果需要落在0到255之间,最多只有256种结果,由上式可以看出,一般情况下,计算出的f(x,y)是个浮点数,我们还需要对该浮点数进行取整。因此,我们可以考虑将该过程中的所有类似于1-x、1-y的变量放大合适的倍数,得到对应的整数,最后再除以一个合适的整数作为插值的结果。

     
如何取这个合适的放大倍数呢,要从三个方面考虑,第一:精度问题,如果这个数取得过小,那么经过计算后可能会导致结果出现较大的误差。第二,这个数不能太大,太大会导致计算过程超过长整形所能表达的范围。第三:速度考虑。假如放大倍数取为12,那么算式在最后的结果中应该需要除以12*12=144,但是如果取为16,则最后的除数为16*16=256,这个数字好,我们可以用右移来实现,而右移要比普通的整除快多了。 

      综合考虑上述三条,我们选择2048这个数比较合适。

      下面我们假定某个算法得到了我们要取样的坐标分别PosX以及PosY,其中PosX=25.489,PosY=58.698。则这个过程的类似代码片段如下:

 1 NewX = Int(PosX)                        '向下取整,NewX=25
 2 NewY = Int(PosY)                        '向下取整,NewY=58
 3 PartX = (PosX - NewX) * 2048            '对应表达式中的X
 4 PartY = (PosY - NewY) * 2048            '对应表达式中的Y
 5 InvX = 2048 - PartX                     '对应表达式中的1-X
 6 InvY = 2048 - PartY                     '对应表达式中的1-Y
 7 
 8 Index1 = SamStride * NewY + NewX * 3    '计算取样点左上角邻近的那个像素点的内存地址
 9 Index2 = Index1 + SamStride          '左下角像素点地址
10 ImageData(Speed + 2) = ((Sample(Index1 + 2) * InvX + Sample(Index1 + 5) * PartX) * InvY + (Sample(Index2 + 2) * InvX + 

                          Sample(Index2 + 5) * PartX) * PartY) \ 4194304       '处理红色分量

11 ImageData(Speed + 1) = ((Sample(Index1 + 1) * InvX + Sample(Index1 + 4) * PartX) * InvY + (Sample(Index2 + 1) * InvX +

                          Sample(Index2 + 4) * PartX) * PartY) \ 4194304       '处理绿色分量
12 ImageData(Speed) = ((Sample(Index1) * InvX + Sample(Index1 + 3) * PartX) * InvY + (Sample(Index2) * InvX +

                      Sample(Index2 + 3) * PartX) * PartY) \ 4194304           '处理蓝色分量

      以上代码中涉及到的变量都为整型(PosX及PosY当然为浮点型)。

      代码中Sample数组保存了从中取样的图像数据,SamStride为该图像的扫描行大小。

      观察上述代码,除了有2句涉及到了浮点计算,其他都是整数之间的运算。

      在BasiC语言中,编译时如果勾选所有的高级优化,则\ 4194304会被编译为>>22,即右移22位,如果使用的是c语言,则直接写为>>22。

      需要注意的是,在进行这代代码前,需要保证PosX以及PosY在合理的范围内,即不能超出取样图像的宽度和高度范围。

      通过这样的改进,速度较直接用浮点类型快至少100%以上,而处理后的效果基本没有什么区别。

时间: 2024-10-23 23:00:40

视频图像处理基础知识0(双线性插值算法进行图像缩放)【转】的相关文章

视频图像处理基础知识4(视频分辨率参考 行频 隔行扫描 逐行扫描)【转】

转自:http://blog.csdn.net/Times_poem/article/details/51470065 版权声明:本文为博主原创文章,未经博主允许不得转载. 需求说明:视频处理基本知识       第一部分:视频分辨率参数       第二部分:分辨率.行频.场频  第一部分:视频分辨率参数 1080p的画面分辨率为1920×1080 [视频分辨率参考]共分为以下5种规格(D1是数字电视系统显示格式的标准): D1:480i格式(525i):720×480(水平480线,隔行扫描

视频图像处理基础知识1(双线性插值算法描述及实现)【转】

 转自:http://blog.csdn.net/Times_poem/article/details/51396826                                        

视频图像处理基础知识5(RGB与Ycbcr相互转换公式 )【转】

转自:http://blog.csdn.net/Times_poem/article/details/51471438 版权声明:本文为博主原创文章,未经博主允许不得转载. 需求说明:视频处理算法基本知识       第一部分:有参考出处的RGB与Ycbcr相互转换       第二部分:简单直接的RGB与Ycbcr相互转换       第三部分:优化乘法的RGB与Ycbcr相互转换        第一部分 来自:http://blog.chinaunix.NET/uid-215617-id-2

《我的视频我做主:Premiere Pro CS5实战精粹》——1.2 视频编辑基础知识

1.2 视频编辑基础知识 本节主要讲解了在进行视频编辑时所需要了解的基本概念.读者通过对本节的学习能够掌握标清视频与高清视频的各自特点.帧速率.像素比等基本概念. 1.2.1 标清视频 标清视频是指标准清晰度的视频格式,英文"Standard Definition",简称"标清",缩写为"SD".具体地说,它是指图像水平清晰度为500-600线,最低为480线,分辨率为720像素×576像素,采用4:3的幅型比的VCD.DVD.模拟制式的电视节目

在JavaScript中处理时间之setMinutes()方法的使用_基础知识

 javascript Date.setMinutes()方法按照本地时间的设置分钟为一个指定日期语法 Date.setMinutes(minutesValue[, secondsValue[, msValue]]) 注:括号内外观和数据是可选的 下面是参数的详细信息:     minutesValue : 0到59之间的整数,表示分钟     secondsValue : 0到59之间的整数,表示秒.如果指定secondsValue参数,则还必须指定minutesValue     msVal

在JavaScript中处理时间之getHours()方法的使用_基础知识

 javascript Date.getHours()方法按照本地时间在指定日期的返回小时.由 getHours 返回的值是0和23之间的整数.语法 Date.getHours() 下面是参数的详细信息:     NA 返回值: 按照本地时间返回指定日期的小时.例子: <html> <head> <title>JavaScript getHours Method</title> </head> <body> <script ty

《Sony Vegas Pro 12标准教程》——第1章 基础篇——基础知识 1.1 影视剪辑的概念

第1章 基础篇--基础知识 在你拿起这本书的时候,我想,你应该已经准备好创作属于自己的影片了:同时,也选择了Sony Vegas作为你的剪辑软件.你的心里既充满了期待,也充满了迷惘.没错,剪辑不仅仅是软件本身的功能,同时也代表了你对于视频画面的深层感悟.那么,即刻起,无论你是一名新手,还是曾经拥有属于自己的影片,都请走进Sony Vegas的世界,去看看Vegas能为你的影片带来哪些令人惊叹的效果. 本章学习要点 了解剪辑的概念与技法 掌握场序.分辨率.宽高比知识 熟悉音视频格式与编解码器 掌握

javascript编码的几个方法详细介绍_基础知识

escape定义和用法 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串. 参数 描述 string 必需.要被转义或编码的字符串.   返回值 已编码的 string 的副本.其中某些字符被替换成了十六进制的转义序列. 说明 该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: * @ - _ + . / .其他所有的字符都会被转义序列替换. 提示和注释 提示:可以使用 unescape() 对 escape() 编码的

《精通Matlab数字图像处理与识别》一6.2 傅立叶变换基础知识

6.2 傅立叶变换基础知识 精通Matlab数字图像处理与识别 要理解傅立叶变换,掌握频率域滤波的思想,必要的数学知识是不能跳过的.为便于理解,我们将尽可能定性地去描述.其实傅立叶变换所必需的数学知识对于一个理工科大学二年级以上的学生来说是很有限的,高等数学中傅立叶级数的知识加上线性代数中基和向量空间的概念就足够了.下面就从一维情况下的傅立叶级数开始进行介绍. 6.2.1 傅立叶级数 法国数学家傅立叶发现任何周期函数只要满足一定条件(狄利赫里条件)都可以用正弦函数和余弦函数构成的无穷级数,即以不