1 数字视频基础知识
学习要点
-
掌握数字视频的基本概念(包括帧速率、像素宽高比和色彩模式等)
-
掌握世界上通用的电视制式(包括NTSC和PAL),以及标清(SD)、高清(HD)乃至2K和4K的定义
-
掌握数字视频技术实际应用领域的相关知识(包括DVD和流媒体)及其发展方向
-
了解数字影视剪辑的基本理论,深入体会蒙太奇与剪辑的关系
1.1 数字视频的基本概念
从动画诞生那时起,人们就不断探求一种能够存储、表现和传播动态画面信息的方式。在经历了电影和模拟信号电视之后,数字视频技术迅速发展起来,伴随着不断扩展的应用领域,其技术手段也不断成熟。
1.1.1 模拟信号与数字信号
以音频信号为例,模拟信号是由连续的、不断变化的波形组成的,信号的数值在一定范围内变化(见图1-1-1),且信号主要通过空气、电缆等介质进行传输;与之不同的是,数字信号以间隔的、精确的点的形式进行传输(见图1-1-2),点的数值信息由二进制信息描述(见图1-1-3)。
数字信号相对于模拟信号有很多优势,最重要的一点在于数字信号在传输过程中有很高的保真度。模拟信号在传输过程中,每复制或传输一次都会衰减,而且会混入噪波,信号的保真度大大降低(见图1-1-4)。而数字信号可以很轻易地区分原始信号和混入的噪波并加以校正(见图1-1-5)。所以数字信号可以满足我们对于信号传输的更高要求,将电视信号的传输提升到一个新的层次。
目前,视频正经历由模拟时代向数字时代的全面转变,这种转变发生在不同的领域。在广播电视领域,高清数字电视正在逐渐取代传统的模拟电视,越来越多的家庭可以收看到数字有线电视或数字卫星节目。电视节目的编辑方式也由传统的模拟(磁带到磁带)编辑发展成为数字非线性编辑(NLE)。在家庭娱乐方面,DVD已经成为人们在家观赏高品质影像节目和数字电影的主要方式;而DV摄像机的普及,也使得非线性编辑(NLE)技术从专业电视机深入到民间,人们可以很容易地制作数字视频影像。数字视频正逐渐融入人们的生活。
1.1.2 帧速率和场
当一系列连续的图片映入眼睛的时候,由于视觉暂留的作用,人们会错误地认为图片中的静态元素动了起来。而当图片显示得足够快的时候,我们便不能分辨每幅静止的图片,取而代之的是平滑的动画。动画是电影和视频的基础,每秒钟显示的图片数量称为帧速率,单位是帧/秒(fps)。大约10帧/s的帧速率可以产生平滑连贯的动画,低于这个速率会产生跳动。
传统电影的帧速率为24帧/s,在美国和其他使用NTSC制式作为标准电视的地区中,视频的帧速率大约为30帧/s(29.97帧/s);而在使用PAL 制式或SECAM制式的英国、部分欧洲地区和亚非地区,电视中视频的帧速率为25帧/s。
在标准的电视机中,电子束在整个荧屏的内部进行扫描。扫描总是从图像的左上角开始,水平向前行进,同时扫描点也以较慢的速率向下移动。当扫描点到达图像右侧边缘时,扫描点快速返回左侧,重新开始在第1行的起点下面进行第2行扫描,行与行之间的返回过程称为水平消隐。一幅完整的图像扫描信号,由水平消隐间隔分开的行信号序列构成,称为一帧。扫描点扫描完一帧后,要从图像的右下角返回到图像的左下角,开始新一帧的扫描,这一时间间隔叫做垂直消隐。
大部分的广播视频采用两个交换显示的垂直扫描场构成每一帧画面,这叫做交错扫描场。交错视频的帧由两个场构成,其中一个扫描帧的全部奇数场,称为奇场或上场;另一个扫描帧的全部偶数场,称为偶场或下场。场以水平分隔线的方式隔行保存帧的内容,在显示时首先显示第1个场的交错间隔内容,然后再显示第2个场来填充第1个场留下的缝隙(见图1-1-6)。每一帧包含两个场,场速率是帧速率的二倍,这种扫描的方式称为隔行扫描。与之相对应的是逐行扫描,每一帧画面由一个非交错的垂直扫描场完成。计算机操作系统就是以非交错形式显示视频的。
电影胶片类似于非交错视频,每次显示整个帧。通过设备和软件,可以使用3-2或2-3下拉法在24帧/s的电影和约为30帧/s(29.97帧/s)的NTSC制式视频之间进行转换。这种方法是将电影的第1帧复制到视频第1帧的场1和场2,将电影的第2帧复制到视频第2帧的场1、场2和第3帧的场1,将电影的第3帧复制到视频第3帧的场2和第4帧的场1,将电影的第4帧复制到视频第4帧的场2和第5帧的场1和场2(见图1-1-7)。这种方法可以将4个电影帧转换为5个视频帧,并重复这一过程,完成24帧/秒~30帧/秒的转换。使用这种方法还可以将24p的视频转换成30p或60i的格式。
1.1.3 分辨率和像素宽高比
电影和视频的影像质量不仅取决于帧速率,每一帧的信息量也是一个重要因素,即图像的分辨率。较高的分辨率可以获得较好的影像质量。
传统模拟视频的分辨率表现为每幅图像中水平扫描线的数量,即电子束穿越荧屏的次数,称为垂直分辨率。NTSC制式采用每帧525行扫描,每场包含262条扫描线;而PAL制式采用每帧625行扫描,每场包含312条扫描线。
水平分辨率是每行扫描线中所包含的像素数,取决于录像设备、播放设备和显示设备。如老式VHS格式录像带的水平分辨率约为250线,而DVD的水平分辨率约为500线。
帧宽高比即影片画面的宽高比,常见的电视格式为标准的4∶3(见图1-1-8)和宽屏的16∶9
(见图1-1-9),一些电影具有更宽的比例。
像素宽高比是影片画面中每个像素的宽高比,各种格式使用不同的像素宽高比(见图1-1-10)。
计算机使用正方形像素显示画面,其像素宽高比为1.0(见图1-1-11);而电视基本使用矩形像素,例如DV NTSC使用的像素宽高比为0.9(见图1-1-12)。如果在正方形像素的显示器上显示未经矫正的矩形像素的画面,会出现变形现象,比如其中的圆形物体会变为椭圆形物体(见图1-1-13)。
帧宽高比由像素宽高比和水平/垂直分辨率共同决定。帧宽高比等于像素宽高比与水平/垂直分辨率比之积。
1.1.4 视频色彩系统
色彩模式即描述色彩的方式。自然界中任何一种色光都可以由红、绿、蓝三原色按不同的比例混合而成(见图1-1-14)。计算机和彩色电视机的显示器使用RGB模式显示色彩,每种色彩使用R、G、B 3个变量表示,即红、绿、蓝三原色。YUV模式也称YCrCb模式,其中Y表示亮度,U和V即Cr和Cb,分别表示红色和蓝色部分与亮度之间的差异,与Photoshop中的Lab模式很相似。
为了保持与早期黑白显示系统的兼容性,需要将RGB模式转化为YUV模式。如果只有Y信号分量,则显示黑白图像;若显示彩色图像,需将YUV模式再转化为RGB模式。使用YUV模式存储和传送电视信号,解决了彩色电视机与黑白电视机之间的兼容问题,使黑白电视机也能接收彩色信号。
色彩深度即每个像素可以显示的色彩信息的多少,用位数(2的n次方)描述,位数越高,画面的色彩表现力越强(见图1-1-15)。计算机通常使用8位/通道(R、G、B)存储和传送色彩信息,即24位;如果加上一条Alpha通道,可以达到32位。高端视频工业标准对色彩有更高的要求,通常会使用10位/通道或16位/通道的标准。高标准的色彩可以表现更丰富的色彩细节,使画面更加细腻,色彩过渡更为平滑。
1.1.5 数字音频
声音是由振动产生的。比如,弦乐器的弦或人的声带产生振动,会带动周围的空气随之振动,振动通过空气分子波浪式地进行传播。当振动波传到人的耳朵时,人便听到了声音。通常可以用波形表示声音。波形中的0线位置表示空气压力和外界大气压相同;当曲线上升时,表明空气压力加强;曲线降低时,表明空气压力下降(见图1-1-16)。声音的波形实际上等同于空气压力变化的波形,声音就是这样在高低气压产生的波动中进行传播的。
计算机可以将声音信息数字化存储。声音波形被分解成独立的采样点,即音频的数字化采样,也称模拟—数字转换。采样的速率决定了数字音频的品质。采样速率越高,数字化音频的波形越接近原始声音的波形,声音品质越好(见图1-1-17);而采样速率越低,数字化音频的波形与原始声音的波形相差越大,声音品质就越差(见图1-1-18)。
声音是影片中不可缺少的一部分,同样,在数字视频领域,音频的数字化也起着至关重要的作用,数字视频与数字音频是相辅相成的整体。
1.1.6 视频压缩
视频压缩也称编码,是一种相当复杂的数学运算过程,其目的是通过减少文件的数据冗余,以节省存储空间,缩短处理时间,以及节约传送通道等。根据应用领域的实际需要,不同的信号源及其存储和传播的媒介决定了压缩编码的方式,压缩比率和压缩的效果也各不相同(见图1-1-19)。
压缩的方式大致分为两种:一种是利用数据之间的相关性,将相同或相似的数据特征归类,用较少的数据量描述原始数据,以减少数据量,这种压缩通常称为无损压缩;另一种是利用人的视觉和听觉的特性,针对性地简化不重要的信息,以减少数据,这种压缩通常称为有损压缩。
有损压缩又分为空间压缩和时间压缩。空间压缩针对每一帧,将其中相近区域的相似的色彩信息进行归类,用描述其相关性的方式取代描述每一个像素的色彩属性,省去了对人眼视觉不重要的色彩信息。时间压缩又称插帧压缩(Interframe Compression),是在相邻帧之间建立相关性,描述视频帧与帧之间变化的部分,并将相对不变的部分作为背景,从而大大减少了不必要的帧的信息(见图1-1-20)。相对于空间压缩,时间压缩更具有可研究性,并有着更加广阔的发展空间。
1.1.7 数字视频摄录系统
DV通常指数字视频。然而,DV也专指一种基于DV25压缩方式的数字视频格式。这种格式的视频信号由使用DV带的DV摄像机产生(见图1-1-21)。DV摄像机将影像通过镜头传至感光原件CCD或CMOS(见图1-1-22),将光学信号转换为电信号,再使用DV25的压缩方式,将原始信号进行压缩,存储到DV带上。
DV摄像机或录像机通过IEEE 1394接口的连接,可以将DV带中记录的数字影像信息上传到计算机中进行后期的编辑处理(见图1-1-23)。
随着技术的不断进步,数字摄像机的存储介质也逐渐向“无带化”的方向发展。磁盘存储、光盘存储和存储卡的应用,使数码摄录系统的采集流程更加高效。主流的硬件厂商都推出了自己的存储卡格式的专业摄录系统,例如,基于P2存储卡的Panasonic P2系统(见图1-1-24)和基于SXS存储卡的Sony XDCAM EX系统(见图1-1-25)。
在数字电影不断发展的今天,对摄录系统的画面质量和存储效率都提出了更高的要求。RED公司率先推出了数字电影机——RED ONE(见图1-1-26)。通用机型成像从2K到4K,高端产品最大成像甚至更高,影像直接记录在硬盘或CF卡中,强大的压缩模式,传320GB的硬盘可以拍摄4K画面2小时左右,后期处理的空间甚至高于电影。4K系统目前慢慢渗透到民用领域。