《数字视频和高清:算法和接口》一1.2几何

1.2几何

在数学中,平面(二维)的坐标值范围包括正值和负值。由此平面分为四个象限(见图14)。象限在逆时针方向上用罗马数字表示。在连续图像平面中,使用直角坐标(x,y)表示位置——第一个坐标值代表水平方向,第二个坐标值代表垂直方向。当x和y都是正值时,位置位于第一象限(象限Ⅰ)。在图像学中,图像就在这个象限(Adobe的PostScript系统使用第一象限坐标)。

笛卡儿坐标系(x,y)定义了四个象限,第一象限包含的点拥有正的x和y值。第一象限的坐标在一些成像系统中被采用,第四象限的点x值为正值,y值为负值。光栅图像坐标点通常表现为随着图像行数增加图像高度下降,也就是说在第四象限,省略了y值的负号

在矩阵索引中,轴的顺序与笛卡儿坐标相反:先索引矩阵的行,再索引矩阵的列。矩阵的最上面一行具有最小的指数,所以矩阵指数位于第四象限。在数学上,矩阵元素通常采用1原点索引标志。有一些图像处理软件使用1原点索引,尤其是MATLAB和Mathematica,这二者均与数学有很大的渊源。传统的视频和图像处理的扫描顺序通常坚持矩阵惯例 ,但都是采用零起源索引:行和列从左上角的(0,0)坐标开始算起被编号为(r,c)。换句话讲,图像位于Ⅳ象限(但省略了y坐标的负号),但通常使用零起源索引。
数字图像采样结构采用宽×高表示。例如,1920×1080系统的列被编号为0到1919,行(史称“图像行”)被编号为0~1079。

时间: 2024-08-01 20:31:13

《数字视频和高清:算法和接口》一1.2几何的相关文章

《数字视频和高清:算法和接口》一3.4“编码100”难题和非线性图像编码

3.4"编码100"难题和非线性图像编码 本文讲的是数字视频和高清:算法和接口一3.4"编码100"难题和非线性图像编码,考虑8位像素值正比于照度,零值代表黑色,最大编码值255代表白色,如图3-3所示.编码100位于某个尺度的点上,这个尺度是,相邻的照度值比率是1%.由于视力的对比度阈值是1%,编码100和101的采样的区域的边界是可以看得到的. 像素值降低到小于100时,相邻代码的不同亮度的差别越来越容易感觉到:在编码20中,相邻的照度值的比率达到5%.在灰色阴

《数字视频和高清:算法和接口》一导读

前言 本文讲的是数字视频和高清:算法和接口一导读,自2003年年初本书第1版问世以来,视频技术不断发展,视频和计算机图形学两者进一步地"融合"(Jim Blinn称之为碰撞).电视正在没落,而计算机技术和网络传输正高奏凯歌.如今,哪怕"TV"这个缩写也是值得怀疑的:在过去的半个世纪中,TV意味着广播,但今天大部分的视频--来自苹果的iTunes商店.Hulu.Netflix.YouTube等--都不是传统意义上的广播.在这一版中,我用SD(标清)和HD(高清)取代S

《数字视频和高清:算法和接口》一3.5线性和非线性

3.5线性和非线性 本文讲的是数字视频和高清:算法和接口一3.5线性和非线性,现代图像传感器如电荷耦合器件(CCD)和互补金属氧化物半导体(CMOS)有效地将光子转化为电子:它们产生的信号,幅度正比于强度,称为线性的.以前视频信号是通过对电压具有线性响应的模拟电路来进行处理的.当今数字信号系统通常在像素值算法上是线性响应的.这种系统经常称为是线性的.然而,如果非线性函数分开了两个领域,在一个领域的线性度就不能跨越到另一个领域.在视频中,场景照度在一个非线性光的领域,视频信号受电器信号领域的线性操

《数字视频和高清:算法和接口》一3.3感知均匀性

3.3感知均匀性 本文讲的是数字视频和高清:算法和接口一3.3感知均匀性如果一个编码值的小扰动在这个值范围内是近似等价感知的,则感知量的编码是均匀的.如果两个照度的比例小于1.01,人眼是不能区分亮度水平的--换句话说,照度差的视觉阈值大约是1%.这种对比灵敏度阈值是由一种测量模式建立的,比如图3-2所示的草图.详细的介绍将会23.3节中展开.理想情况下,像素值会被放置在沿着从参考黑色到参考白色的恰好辨识差(JND)递增的地方. 图3-2对比灵敏度测试 图3-2所示的是对比敏感度测试模式显示,在

《数字视频和高清:算法和接口》一1.8数字图像的表示方法

1.8数字图像的表示方法 静态数码图像和动态序列可用许多不同的文件.内存和流媒体格式用来传输.大多数情况下每个像素的格式都有3个分量值(来描绘附加的红.绿和蓝三种颜色分量).在消费级别的电子和商品计算中,大多数格式每个分量会有8位.在专业应用,如在视频工作室和数字影院的应用中,每个分量上有10位.12位,乃至更多位数也是正常的. 成像系统通常用于优化人类感知的其他方面,举例来说:JPEG和MPEG压缩系统利用视觉的空间频率特性进行压缩.这样的优化通常称为感知编码. 实际中,几乎全部商业成像系统都

《数字视频和高清:算法和接口》一1.1幅型比概念

1.1幅型比概念 简单地说,幅型比是指一副图像的宽度和高度的比例.电影和视频的标准的幅型比如图1.2所示.本书中所说的幅型比有时称为显示幅型比(DAR)或图片幅型比(PAR).标准清晰度(SD)电视的幅型比为4∶3. 式(1-1)是关于图像和样本的幅型比.为了给幅型比为AR的图像赋值n阶方阵采样像素,根据式(1-2),选择图像列和图像的行进行计数(分别为c和r). 电影胶片通常采用1.85∶1(由于历史原因,它被称为平面或者球面),或2.4∶1("宽银幕电影",或俗称宽银幕).很多电影

数字视频和高清:算法和接口》一1.10方形采样

1.10方形采样 在现代数字成像,包括计算.数字摄影.图形艺术.高清视频系统中,采样点(即像素)通常在水平方向和垂直方向均匀分布--它们在水平和垂直方向采样密度相同.这些系统采用方形("方形像素点")采样,它们有相同的采样幅型比(SAR).通过使用方形采样,图像的列数与图像行数的比值即为采样幅型比.这里的方形一词指的是采样的方法,并不是指图像信息均匀分布在与每个像素相关的正方形区域,一些1080i的高清压缩系统像素幅型比达到4/3或3/2.传统的成像和包括数字标清系统在内的视频系统水平

《数字视频和高清:算法和接口》一1.5感知均匀性

1.5感知均匀性 如果小扰动编码值在感知量的取值范围内是近似相等可察觉的,那么该感知量可以以感知均匀方式进行编码.考虑收音机的音量控制.如果它物理上是线性的,那么响度感知的对数性质将大部分的感知"动作"控制在取值范围的底部.相反,控制的目的是均匀感知.图17所示的为带有标准音量锥形调节器的电位器的传递函数. 音量锥形调节器在音量调节上采用感知均匀的方式 转动角映射到声压级,这样旋转旋钮10°产生一个在控制范围内的近似声音知觉增量.这是许多内建于电子系统工程中的感知考虑的例子之一(另一

《数字视频和高清:算法和接口》一1.13帧频

1.13帧频 标清广播电视一直以来使用隔行扫描方式.在480i(NTSC)系统中,规定帧频为30/1.001Hz(29.97Hz):在576i(PAL)系统中,规定帧频为25Hz.复合PAL制与NTSC制视频帧频是固定的.分量视频系统在帧频的选择上具有灵活性.但是,生产者和分频设施通常会将其锁定在一.两个帧频上,25Hz或29.97Hz对于频段的国际分配来说,帧频转换在分频设施与消费者设备处均很重要.帧频曾经以区域为基础划分,以配合现行交流(AC)电源线频率.20世纪90年代,曾致力于为高清建立

《数字视频和高清:算法和接口》一1.9标清和高清

1.9标清和高清 1995年以前,"电视"一词专指视频格式为480i(历史上表示为525/59.94,或称"NTSC")或者576i(表示成625/50,或称"PAL")的电视标准.宽屏电视,高清晰度电视(HDTV)等其他新电视系统的兴起,为电视这个术语引入了更多的不确定性.我们以前所说的电视现在应该称为标清电视(SDTV).广泛使用的视频技术正逐步将娱乐节目和传统意义上的电视分开,而应用软件又如此丰富多彩,所以我往往将"电视"