您好,欢迎来到东莞市标远线缆有限公司(www.bellwin.com.cn)官方网站!

中国优质的标远线缆品牌供应商

专业智能化电线电缆方案解决专家

十年专注电线电缆发展和应用

更多>>推荐产品

更多>>联系我们

  • 东莞市标远线缆有限公司
  • 电话:0769-22668009
  •     0769-23366301   
  • 传真:0769-27200866
  • 联系人:王小姐
  • Email:bellwin@foxmail.com
  • 地址:东莞市高埗镇高龙路高龙
  •     科技园B栋
您当前的位置:首页 -> 技术支持 - 弱电布线相关技术

图像压缩的有关标准

来源:《网络与电视监控工程监理手册》黎连业、黄子河、及延辉 编著-仅供学习参考更新时间:2014-07-23
分享到:

图像压缩的有关标准

(一)     静止图像压缩标准(JPEG

 

为了压缩连续色调(即灰度级或彩色)的静止图像,“联合图片专家组”(Joint Photographic  Expert  Group,简称JPEG,1986年成立)于1991年3月提出了ISO/IEC 10918 号建议草案:“连续色调静止图像的数字压缩编码”(Didital  Compression  and  Coding  of Continuous-tone  Still  Images),1992年正式通过。JPEG算法的平均压缩比为15∶1,当压缩比大于50倍时将可能出现方块效应。这一标准使用黑色及彩色照片、传真和印刷图片。

 

JPEG2000是一个新的标准,是将JPEG标准进行升级的换代的一个新标准。根据专家组确定的目标,该标准不仅能提高图像的压缩质量,尤其是低码率时的压缩质量,而且还将得到许多新功能,包括根据图像质量、视觉感受和分辨率进行渐进传输,对码流的随机存取和处理,开放结构,向下兼容等。JPEG2000于1999年3月形成工作草案,2000年正式颁布。

 

Motion-JPEG(MJPEG是“Motion JPEG”的缩写),是利用JPEG标准定义图像压缩,从而可以生成序列化运动图像,是全动的JPEG影像,所以MJPEG实际上是静止画片与活动图像之间的中间格式,因其压缩后格式可读单一画面,所以可以任意剪接。MJPEG采用帧内压缩方式,适于视频编辑,如果采用高压缩比则视频质量会严重降低。JPEG的最新进展是多层式JPEG压缩技术。它先传低清晰度的画面,故成像速度快得多;然后在补送细节的压缩资料,使换面面品质改善;最后再补送更细节的压缩资料,使画面品质更加完善。一帧一帧的JPEG画片,因为每帧都可以任意存取,所以MJPEG长常被用于视频编辑系统。由于MJPEG不是一个标准化的格式,各厂家都有自己版本的MJPEG,双方的文件无法相互识别。

 

(二)     运动图像压缩标准(H.26X系列)

 

1、 CCITT H.261

 

1984年CCITT为制订ISDN视频信号传输标准而成立了“可视电话编码特别组”,1988年由可视电话编码组(CCITT SG15)提出CCITT的H.261建议,1990年12月通过了H.261即р×64kbps视听业务用的视频解码器(Video Coder/Decoder for Audiovisual Ser-vicer at р×64kbps)。

 

这个建议是针对运动实时动态图像的压缩编码和解码,应用目标是可视电话和电视会议。其中р是一个可变参数,取值范围是1~30,所以H.261建议的最低传输速度是64kbps。р=1或2时,支持四分之一格式(Quarter Common Intermdiate Format,QCIF)。每秒帧数较低的视频电话,QCIF格式的色度信号分辨率为90×70像素,亮度信号分辨率为180×144像素。当р>6时可支持通用的中间格式(Common Intermiate Format,CIF)。每秒帧数较高的电视会议,CIF格式的色度信号分辨率为180×144像素,亮度信号分辨率为360×288像素。

 

电视电话/会议电视р×64kbpsCCITT H.261)视频压缩算法采用混合编码方法,压缩比可达481H.26覆盖了641920kbps的信道,它的原理框架奠定了以后MPEG标准的基础。。

   

H.261建议利用视频信号帧间的相关性,可以获得较大的压缩率。它包括信源编码和统计编码两部分。信源编码采用有损编码方法,又分帧内编码和帧间编码两种情况。帧内编码减少空域冗余信息,一般采用单一的基于DCT的变换编码方法,DCT系数经线性量化,在经视频多路编码器进入缓冲器。根据缓冲器的空、满度,改变量化器的步长来调节视频信息比特流,与信道传输速度匹配。帧间编码可减少冗余信息,一般采用混合编码方法。用DPCNM编码方法对当前宏块与该宏块的预测值的误差进行编码,当误差大于某个给定的阔值时,对这些误差进行DCT变换、量化处理,然后和运动矢量信息一起传送给视频多路编码器。统计编码则是利用信号的统计特性来减少比特率。

 

2、     CITT H.263

 

H.263是基于运动补偿的DPCM的混合编码,在运动搜索的基础上进行运动补偿,然后运用DCT变换和“之”字形扫描游程编码,从而得到输出码流。H.263H.261建议的基础上,将运动矢量的搜索增加为半像素点搜索;同时又增加了无限制运动矢量、基于语法的算术编码、高级预测技术和PB帧编码等四个高级选项;从而达到了进一步降低速率和提高编码质量的目的。

 

1995年制订的H.263视频编码标准是为高质量运动图像压缩所设计的低码率图像压缩标准。与H.261的传输码率相比,H.263码率更低,单位码率可以小于64kbps,且支持的原始图像格式更多,包括了在视频和电视信号中常见的QCIFCIFFDTVITU-R 601ITU-R 709等等。

 

H.263采用运动视频编码中常见的编码方法,将编码过程中分为帧内编码和帧间编码两个部分。在帧内用改进的DCT变换并量化,在帧间采用1/2像素运动矢量预测补偿技术,使运动补偿更加精确,量化采用改进的变长编码表(VLC)对量化数据进行熵编码,得到最终的编码系数。

 

H.263的编码速度快,其设计编码延时不超过150ms;码率低,在215kbps乃至384kbps带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的场合和网络条件不是很好的场合。H.263采用如下方法:

 

l  信源编码基于通用中间格式(CIF),使其可以同时应用于625线和525线两种电视标准。视频编码器对图像的取样次数为视频信号长信的整数倍,取样时钟和数字网之间的关系式异步关系,提供可以和其他各种设备信号相结合的独立的数字比特流。

l  采用可减少时间冗余的帧间预测和可减少空间冗余的残留信号编码方法。解码器具有运动补偿的能力,并允许可选择地在编码器中增加这种技术。H.263运动补偿采用的是半像素精度,而不是H.261建议中的全部像素精度和循环滤波器。而对待传送的符号采用了编程编码。

 l  允许采用无限制运动矢量模式,在该模式中,运动矢量被允许指到图片的外部,可适用更大的运动矢量。允许采用基于句法的算法编码模式代替游程编码,可将是最终的比特数显著降低。允许采用高级预测模式,对P帧的亮度部分采用了块重叠运动补偿。对图片中的某些宏块采用48×8矢量来代替原来的116×16矢量。编码器必须决定使用哪一种矢量。允许采用PB帧模式,一个PB帧包含一个由前面的解得到的P帧图像预测得出的P帧和一个由前一个P帧和当前解码的P帧共同预测得出的B帧。使用这种模式可以在比特率增加幅度很小的情况下大幅度增加视频。

 l  信源编码器的主要原理预测、块变换和量化。信源格式信源编码器对每秒发生30 000/1001(大约29.97)次的图像进行操作。对图像频率的允许误差为±50×10-24m。采用五种图像格式,图像被编码为一个亮度信号和两个色差成分(YCBCR)。五种标准图像格式为:sub-QCIFQCIFCIF4CIF16CIF。对每种图像格式,色差取样被定位在和亮度块边界一致的快土。取样像素的纵横和图像格式的纵横比一致,也和H.261建议中定义的QCIFCIF一致:(4/3)×(288/352)。除了sub-QCIF格式的纵横比为43.

   

3、     CITT H.26LH.264

 H.26L和H.2642002年正在订制的标准,它具有柔性、高质量的视频传输特性。

 

(三)  运动图像压缩标准(MPEG-1

   “运动图片专家组Moving  Picture Expert GroupMPEG )提出的“用于数字存储媒体运动图像及其伴音率为1.5Mbps的压缩编码”(Coding  of Moving  Picture  and Associated  Audio  for Digital  Storage  Media  at up to about 1.6Mbps),简称为MPEG-1,作为ISO CD 11172号建议于1992年通过。它包括三个部分:MPEG视频、MPEG音频和MPEG系统。

 

MPEF-1标准的平均压缩比为501,其处理能力可达到360×240像素。

 MPEG-1视频压缩算法采用了三个基本技术:运动补偿(预测编码和插补编码)、DCT变换编码技术和熵编码技术。在MPEG-1中,DCT不仅用于帧内压缩,对于帧间预测误差在作DCT变换,可减少空域冗余,以达到进一步雅朵的目的。由于视频和音频需要同步,所以MPEG压缩算法应该对二者联合考虑,最后产生一个电视质量的视频和音频压缩形式的位速率约为1.5MbpsMPEG-1单一位流。

 MPEG-1的图像编码过程中基本与H.261一样,基本编码映射表与H.261一致。主要区别在于帧间预测不但有钱前向预测,而且有反向预测。帧间误差基于有运动补偿的前向和双向预测。

 MPEG-1视频压缩技术,一是基于16×16子块的运动补偿,可以减少帧序列的时域冗余度;二是基于DCT的压缩技术,减少空域冗余度。在MPEG中,不仅在帧内使用DCT,而且对帧间预测误差也作DCT,以进一步减少数据量。

 为了减少时间冗余量,MPEG-11/30s时间间隔的帧序列视频图像,以三种烈性的图像格式表示:帧内图(I)、预测图(P)和插补图(B)。

 MPEG-1标准将序列图像分成组,图5表示出其中相邻的9帧。第1帧用I表示,在这一帧中只进行帧内编码,不作帧间预测,只将图像进行DCT、量化,然后进行哈夫曼编码。

 

两个I帧之间的图像称为一组图像。组内的P帧图像,采用具有运动补偿的前向预测,而B帧采用双向预测。如果序列图像如H.261标准那样,只采用前向预测,而B帧采用双向预测。如果序列图像如H.261标准那样,只采用前向预测,那么解码器要恢复某一帧图像,就必须知道前面的所有帧图像,难以实现中某一帧,或某一段时间内图像的调取。采用图像分组的方式,在I帧的位置上留下了随机访问的入口,则可保证支持多媒体所必须的交互工作。MPEG-1在信源输入格式(SIF)下,压缩后可达到的码率约为1.5Mbps(其中包括双通道的立体声信号)。对PAL制,SIF格式为352×288×25帧。

        其中帧内图(I)以静止图像压缩方式处理,必须传送;预测图(P)要用前面的帧内图进行预测,对预测误差做有条件的传送;插补图(B或称双向预测图)可以根据前、后图的信息进行双向插补,帧间的信息用运动补偿的方法确定。运动补偿有两种算法。

   

1.  运动补偿预测法

 画面上的运动部分在帧与帧之间必然有连续性,预测法根据这一特性,将当前的图像画面看做是前面某时刻图像的位移,位移的幅度和方向在图像画面的各处可有不同。因此,利用反映运动的位移信息和前面某时刻的图像,可以预测出当前的图像。

 

2.  运动补偿插补

 用插补的方法进行运动的补偿,可以大幅度地压缩运动图像的信息。在时域中插补运动补偿是一个多分辨率技术,可以以1/10s1/15s的时间间隔取出参考子图,然后对两个参考子图之间的图像,按照运动的规律得到1/30s时间间隔的各个插补子图。只要对参考子图及反映运动规律的信息进行编码,就可以得到帧率为30f/s的全运动视频图像。运动补偿插补又称双向预测,它既可以利用前面图的信息,又可利用后面图的信息。由于视频信号的时域(帧间)冗余很高,需要传送的附加运动校正信息非常少,所以插补运动补偿可大幅度的压缩数据。当然,如果插补图过多,尽管压缩比增加,但图像的质量会降低。

 

(四)运动图像压缩标准(MPEG-4

 MPEG于19915月提出关于视频音频编码的MPEG-4项目,该系统、音频、视频、需求、实现研究、测试及自然合成混合编码(SN HC)子组,199811月成为国际标准,

 

M4PEG-4是ISO为传输数码率低于64Mbps的实时图像设计的。与此同时,国际标准化组织ITU-TLBC工作组以极低数码率电视电话(Very Low Bit Rate Visual Telephony)为目的的工作在19951月形成了H.263视频压缩编码草案。与JPEGMPEG-1MPEG-2等其他标准所采用的基本压缩算法不同,该标准采用基于模型的编码、分形编码等方法,以获得极低码率的压缩效果。所涉及的应用范围覆盖了有线、无线、移动通信、Internet以及数字存储回放等各个领域,它在信息描述中首次采用了“对象”(Object)的概念,因此,是以内容为中心的描述方法,对信息元的描述更符合人的心理,不仅获得比现有标准更优越的压缩性能,也提供了各种新的功能的应用。

 

1.  MPEG-4的主要特点

 

MPEG-4旨在将众多的多媒体应用于一个完整的框架内,为不同性质的视音频数据制定通用、有效的编码方案,提出基于具体内容(Content-based)的视频对象(Video Object)的编码标准。

 

MPEG-4是一种高效率的编码标准,其应用范围最宽到数字电视,最低可到移动多媒体和电子游戏,编码比特率相应可分为384kbps1Mbps6438kbps64kbps以下。并对多媒体应用领域的各种编码进行兼容。

 

MPEG-4又是第一个使用户可在接受端对画面进行操作和交互访问的编码标准。由于MPEG-4基于对视频对象(AVO)独立编码,必须同时传送编码对象的组成结构信息“场景描述”。“场景描述”信息是独立传输的,解码时在解码端可改变选定AVO的“场景描述”参数,对图像和声音的有关内容进行编辑和操作。

 

MPEG引入了合成与自然混合编码。以往的编码把人工合成信息视为自然信息的一个子集,如把计算机图形视为视频,MPEG-4把这类数据视为一种新的数据类型,支持对人工合成AVO数据与自然AVO数据混合编码,这样的合成编码不仅可极大地提高编码效率(可获得1kbps的超低码率),而且可用于实现虚拟电视会议系统,丰富用户与场景的交互。

 

MPEG-4提供了基于内容(对象)的随机存取方式,在有限的时间内能以较高的分辨率,按帧或任意形状对象,对一个音视频序列进行随机存取。例如,可以把一个序列中的某个音视频对象作为目标进行快速搜索。

 

MPEG-4的编码系统是开放的,为各种多媒体应用提供灵活的框架和一套开放的编码工具,不同的应用可选取不同的算法。

 

2.  MPEG-4的组成

 

MPEG-4的标准名是Very-Low Bit Rate Audio-Visual Coding(甚低速率视听编码)。截止到19989月,已作为国际标准草案DIS(Draft Tnternational Standard)MPEG-4文件有5个部分,他们是:

 

MPEG-4系统标准,标准名是ISO/IEC DIS 14496-1 Very-Low Bit Rate Audio-Visual Coding-Part1Systems

 

MPEG-4电视图像标准,标准名是ISO/IEC DIS 14496-2 Very Low Bit Rate Audio-Visual Coding-Part2VideoMPEG-4。支持自然和合成的视觉对象的编码。合成的视觉对象包括2D3D动画和人面部表情动画等。

 

MPEG-4声音标准,标准名是ISO/IEC DIS 14496-3 Very Low Bit Rate Audio-Visual Coding-Part2VideoMPEG-4。不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。既一个场景中,同时有人声和音乐,它们也许是独立编码的音频对象。

 

MPEG-4一致性测试标准,标准名是ISO/IEC DIS 14496-4 Very Low Bit Rate Audio-Visual Coding-Part4Conformance Testing

 

MPEG-4参考软件,标准名是ISO/IEC DIS 14496-5 Very Low Bit Rate Audio-Visual Coding-Part5Reference  Software

 

MPEF-4传输多媒体集成框架,标准名是ISO/IEC DIS 14496-6 Very Low Bit Rate Audio-Visual Coding-Part6Delivery Multimedia Integration FrameworkDMIF)。主要解决交互网络中、广播环境下及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的握手和传输。与过去不同的是,由于MPEG-4码流中,包括许多的AV对象,一般而言,这些AV对象多由各自的缓冲器,而不仅仅是视频缓冲器和音频缓冲器。通过DMIF,MPEG-4可以建立起特殊品质服务(QoS)的信道和面向每个基本流的带宽。