一、什么是H.264压缩格式?
H.264是ITU-T的视频编码专家组(VCEG)和ISO/IEC的活动图像编码专家组(MPEG)的联合视频组(JVT:joint videoteam)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分。H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。JVT(JointVideoTeam,视频联合工作组)于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为 AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。H.264标准可分为三档:
A、基本档次(其简单版本,应用面广);
B、主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等);
C、扩展档次(可用于各种网络的视频流传输)。
H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据进行封装打包后使其在网络中传送,它采用统一的数据格式,包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。包头中包含存储标志和类型标志。存储标志用于指示当前数据不属于被参考的帧。类型标志用于指示图像数据的类型。VCL可以传输按当前的网络情况调整的编码参数。
二、H.264的特点
H.264和H.261、H.263一样,也是采用DCT变换编码加DPCM的差分编码,即混合编码结构。同时,H.264在混合编码的框架下引入了新的编码方式,提高了编码效率,更贴近实际应用。H.264没有繁琐的选项,而是力求简洁的“回归基本”,它具有比H.263++更好的压缩性能,又具有适应多种信道的能力。H.264的应用目标广泛,可满足各种不同速率、不同场合的视频应用,具有较好的抗误码和抗丢包的处理能力。H.264的基本系统无需使用版权,具有开放的性质,能很好地适应IP和无线网络的使用,这对目前因特网传输多媒体信息、移动网中传输宽带信息等都具有重要意义。尽管H.264编码基本结构与H.261、H.263是类似的,但它在很多环节做了改进,现列举如下。
1、多种更好的运动估计
一是高精度估计
在H.263中采用了半像素估计,在H.264中则进一步采用1/4像素甚至1/8像素的运动估计。即真正的运动矢量的位移可能是以1/4甚至1/8像素为基本单位的。显然,运动矢量位移的精度越高,则帧间剩余误差越小,传输码率越低,即压缩比越高。在H.264中采用了6阶FIR滤波器的内插获得1/2像素位置的值。当1/2像素值获得后, 1/4像素值可通过线性内插获得,对于4:1:1的视频格式,亮度信号的1/4 像素精度对应于色度部分的1/8像素的运动矢量,因此需要对色度信号进行1/8像素的内插运算。理论上,如果将运动补偿的精度增加一倍(例如从整像素精度提高到1/2像素精度),可有0.5bit/Sample的编码增益,但实际验证发现在运动矢量精度超过1/8像素后,系统基本上就没有明显增益了,因此,在H.264中,只采用了1/4像素精度的运动矢量模式,而不是采用1/8像素的精度。
二是多宏块划分模式估计
在H.264的预测模式中,一个宏块(MB)可划分成7种不同模式的尺寸,这种多模式的灵活、细微的宏块划分,更切合图像中的实际运动物体的形状,于是,在每个宏块中可包含有1、2、4、8或16个运动矢量。
三是多参数帧估计
在H.264中,可采用多个参数帧的运动估计,即在编码器的缓存中存有多个刚刚编码好的参数帧,编码器从其中选择一个给出更好的编码效果的作为参数帧,并指出是一帧被用于预测,这样就可获得比只用上一个刚编码好的帧作为预测帧的更好的编码效果。
2、更精确的帧内预测
在H.264中,每个4?4块中的每个像素都可用17个最接近先前已编码的像素的不同加权和来进行帧内预测。
3、统一的VLC
H.264中关于熵编码有两种方法。
统一的VLC(即UVLC:Universal VLC)。UVLC使用一个相同的码表进行编码,而解码器很容易识别码字的前缀,UVLC在发生比特错误时能快速获得重同步。内容自适应二进制算术编码(CABAC:Context Adaptive Binary Arithmetic Coding)。其编码性能比UVLC稍好,但复杂度较高。
三、H.264的应用
SONY最新推出了Sony PCS-1 机顶视频会议系统,其应用范围十分广泛,包括数字电影、数字广播、数字有线电视、宽带内容服务、家用录像设备、网络广播、网络会议、IP监看等领域均可使用这一系统。SONY本身就是一家消费类电子产品的公司,因此在电子方面的应用也非常广泛。要实现SONY的产品与其它产品的互通性,需要采用H.241网络传输,而不同提供商之间则可采用H.264实现彼此之间的互操作性,比如在容量交换、IP上载荷格式等方面均可应用H264。
四、什么叫MPEG压缩格式?
MPEG格式,它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG的压缩方法依据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有三个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。
MPEG-1:制定于1992年,它是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。也就是我们通常所见到的VCD制作格式。使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2GB左右大小。这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。
MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。这种格式主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用。使用MPEG-2的压缩算法,可以把一部120分钟长的电影压缩到4到8GB的大小。这种视频格式的文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。
MPEG-4:制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积视频文件。另外,这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。这种视频格式的文件扩展名包括.asf、.mov和DivX AVI等。
细心的用户一定注意到了,这中间怎么没有MPEG-3编码?实际上,大家熟悉的MP3就是采用的MPEG-3(MPEG Layeur3)编码。
五、MPEG4与MPEG1,2的区别
MPEG1、2的文件扩展名为mpg或mpeg!而MPEG4则是avi,微软最新的asf格式也采用了MPEG4压缩技术. 关于画质,MPEG 2要优于MPEG4但体积巨大,MPEG4的画质与体积较为平衡,是一种折中方案,MPEG4支持流媒体播放.
六、视频压缩技术应用环境和压缩比例参考:
MPEG1、MPEG2、MPEG4标准比较
MPEG1的标准制定于1992年左右,它是将视频数据压缩成1-2MB/S的标准数据流,对于动作不激烈的视频信号能获得较好的图像质量。但如果图像对象动作激烈时,图像有可能产生马赛克现象,此种标准没有定义用于额外数据流进行编码的格式,它主要用于家用VCD,并且它需要的存储空间较大,以下举例说明:
如果用清晰度为352x288的彩色画面,采用25帧/每秒,压缩比为50:1时,实际录像一小时,经测算得知需存储空间为600MB左右,若实现8路监控每天录像10个小时,每月30天的话,则需硬盘空间为1440GB,这很难让人接受。
MPEG2制定于1994年,它的出现是为了进一步争取更高的分辨率(720x480),提供广播级视频和CD级的音效,它是非常高质的影音编码系统。传输速率在3-10Mbit/S之间,并可支持隔行扫描视频格式和其他先进功能,可应用于各种速率和各种分辨率的场合。但最大的缺点还是数据量过大。
MPEG4制定于1998年,视频质量及分辨率很高,而数据速率相对较低。主要原因在于:采用ACE技术,它是一套首次针对应用于MPEG4的编码运算规则。与ACE有关的目标定向可以启用很低的数据率。与MPEG2相比,可节约存储空间。还可以在声视频流中广泛的升级。当视频在5Kb/S-10Mb/S之间变化时,声频可以在2Kb/S-24Kb/S 之间进行处理。
在这里要特别强调的是MPEG4标准是针对对象的压缩方式,不同于MPEG1, MPEG2简单地将图像分成一些像块,而是根据图像内容,将其中的对象(物品、人物、背景)分离出来,并分别进行帧内、帧间编码压缩,并允许在不同的对象之间灵活分配码率,对重要的对象分配较多的字节,对次要的对象分配较少的字节,从而大大提高了压缩比,使其在较低的码率下获得较好的效果。
MPEG4的面向对象的压缩方式也使图像探测功能和准确性更加充分体现,由于图像探测功能使硬盘录像机系统具有较之以往更优秀的视频移动报警功能。
MPEG4是一种崭新的低码率、高压缩比的视频编码标准,传输速率为4.8-64kbit/S,使用时占用的存储空间比较小,例如:对于清晰度352x288的彩色画面,其每帧占用空间为1.3KB时,选25帧/每秒,则一小时需120KB,每天10小时、每月30天,则每路每月需36GB、两路需72GB、四路需144GB若是8路则需288GB,这显然是可以为用户所接受的。
h.264使图像压缩技术上升到了一个更高的阶段,能够在较低带宽上提供高质量的图像传输,这正好适应了目前国内运营商接入网带宽还非常有限的状况。在不久前中国电信举行的IPTV解决方案测试中,已经把能否支持端到端的h.264编解码作为考察的一项重点。