数字电视原理第5章-视频压缩编码标准-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字电视原理第5章-视频压缩编码标准-课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字电视 原理 视频压缩 编码 标准 课件
- 资源描述:
-
1、第5章视频压缩编码标准 5.1 视频压缩编码标准的发展历程 5.2 H.261标准 5.3 JPEG标准 5.4 MPEG-1标准5.5 MPEG-2标准 5.6 H.263建议 5.7 MPEG-4标准 5.8 H.264标准 习题 第第5章章 视频压缩编码标准视频压缩编码标准 第5章视频压缩编码标准 5.1 视频压缩编码标准的发展历程视频压缩编码标准的发展历程视频压缩编码标准的制定工作主要是由国际标准化组织(ISO/IEC)和国际电信联盟(ITU)完成的。到目前为止,由上述两个国际组织制定了MPEG-1、MPEG-2、MPEG-4(2)以及MPEG-4(10)和H.261、H.262、H.
2、263、H.263+、H.263+、H.264等有关视频压缩编码的国际标准。表5.1.1 按时间顺序给出了各种视频压缩编码标准。第5章视频压缩编码标准 第5章视频压缩编码标准 第5章视频压缩编码标准 图5.1.1表示出了视频压缩编码标准的发展历程,其中横虚线以上表示由ITU制定的压缩编码标准,横虚线以下表示由ISO/IEC制定的标准,压在横虚线上的方框表示由ISO/IEC与ITU联合制定的压缩编码标准。第5章视频压缩编码标准 图 5.1.1 视频压缩编码标准的发展历程第5章视频压缩编码标准 由表5.1.1和图5.1.1可见,图像压缩编码标准可分为两大系列:MPEG-X和H.26X。MPEG-X
3、是由国际标准化组织(ISO)和国际电工委员会(IEC)提出的标准,H.26X 是由国际电信联盟(ITU)标准委员会提出的,它们在数据格式和输出码率之间有如表5.1.2所示的对应关系。第5章视频压缩编码标准 第5章视频压缩编码标准 1.ISO/IEC颁布的标准颁布的标准国际标准化组织(International Organization for Standardization,ISO)是目前世界上最大、最具权威性的国际标准化专门机构。国际电工委员会(International Electrotechnical Commission,IEC)是世界上最早的国际性电工标准化机构。MPEG-1是由IS
4、O和IEC共同委员会中的MPEG组织于1992年制定的。它最初用于数字信息存储体上活动图像及其伴音的编码,其数码率为1.5 Mb/s,图像采用CIF(Common Intermediate Format)格式(352288像素或352240像素),每秒30帧,两路立体声伴音的质量接近CD音质,该标准广泛应用于VCD。MPEG-2是由ISO的活动图像专家组和ITU的第15研究组于1994年共同制定的,在ITU的标准中,被称为H.262。第5章视频压缩编码标准 MPEG-2作为计算机可处理的数据格式,主要应用于数字存储媒体、视频广播和通信领域,它的数码率为240 Mb/s。随着用户对音频和视频等宽
5、带业务的需求和宽带网络的迅速发展,MPEG-2的视频流逐渐被用户接受,VOD(Video On Demand,视频点播)视频流典型速率将达到36 Mb/s。另外,HDTV(High Definition Television,高清晰度电视)的出现,是视频业务发展的另一个高级阶段。MPEG组织于1999年1月正式公布了MPEG-4(1)版本,1999年12月又公布了MPEG-4(2)版本。MPEG组织的初衷是制定一个针对视频会议、视频电话的超低比特率(64 kb/s以下)编码的标准,并打算采用第二代压缩编码算法,以支持甚低数码率(Very Low Bit Rate)的应用。第5章视频压缩编码标准
6、 但在制定过程中,MPEG组织深深感到人们对多媒体信息特别是对视频信息的需求由播放型转向了基于内容的访问、检索和操作,所以修改了计划,制定了现在的MPEG-4。MPEG-7和MPEG-21不是针对视频压缩的标准。MPEG-7旨在解决对多媒体信息描述的标准问题,并将该描述与所描述的内容相联系,以实现快速、有效的检索。MPEG-21的目标是定义一个交互式多媒体框架,跨越大范围内不同的网络和设备,使用户能够透明而广泛地使用多媒体资源。第5章视频压缩编码标准 H.264/AVC标准是当前国际上最新的图像编码标准。它被ITU命名为H.264,ISO/IEC则把此标准叫做国际标准1449610(MPEG-
7、4(10)高级图像编码(AVC)。制定此标准的主要目的就在于增强图像的压缩效率和改善图像数据在网络中的传输。H.264标准在当前图像标准中压缩效率是最高的,它比H.263标准提高将近一倍。本章首先介绍H.264标准的制定背景,然后讲述标准的应用范围和技术特点,最后简述整个标准的编码流程,这样可更好地理解解码过程。第5章视频压缩编码标准 2.ITU颁布的标准颁布的标准国际电信联盟(International Telecommunication Union,ITU)是联合国的一个专门机构,是国际电信界最权威的标准修订组织。1972年12月,电信标准化部、无线电通信部和电信发展部承担着ITU的实质性
8、标准制定工作。其中,电信标准化部门由原来的国际电报电话咨询委员会(CCITT)和国际无线电咨询委员会(CCIR)的标准化部门合并而成,其主要职责是实现国际电信联盟有关电信标准化的目标,使全世界的电信标准化。H.261是国际电报电话咨询委员会(CCITT)制定的第一个视频编码标准,它的数码率是P64 kb/s,主要应用于ISDN(Integrated Services Digital Network)、ATM(Asynchronous Transfer Mode)等宽带信道上实时的传输声音和图像信息,不适合在PSTN(Public Switched Telephone Network)和移动通信
9、网等带宽有限的网络上应用。第5章视频压缩编码标准 H.262也相当于MPEG-2,它是由ITU与ISO/IEC联合开发的,目前这个标准已经成功地应用在DVD(数字化视频光盘)、数字广播、数字电视等诸多领域。为了满足低速率视频通信的应用需要,ITU又推出了适于在速率低于64 kb/s的信道上传输的H.263视频编码标准。H.263算法所用的基本结构来自H.261,并在H.261的基础上做了许多重要改进。1998年,ITU推出的H.263+是H.263的第二版,它在前一版的基础上提供了12个新的可选模式和其它特征,进一步提高了压缩编码性能。ITU在对H.263标准进行不断的改进和完善的过程中制定了
10、近期目标和远期目标。近期目标是H.263+(H.263第三版,2000年制定),而远期目标就是于1998年开始制定的H.26L标准。第5章视频压缩编码标准 2001年,ISO的活动图像专家组(MPEG)和ITU的视频编码专家组(VCEG)组成联合视频专家组(JVT)共同推进视频压缩技术的发展,在2001年9月JVT的第一次会议上制定了以H.26L为基础的H.264标准草案和测试模型TML-9(Test Model Long Team Number 9)。2003年3月,JVT形成了最终标准草案,分别提交ITU和ISO/IEC,其中该标准在ITU标准中被称为H.264,在ISO/IEC标准中被称
11、为MPEG-4的第10部分先进视频编码(AVC)。第5章视频压缩编码标准 3.超高清晰度成像超高清晰度成像(HRI)建议建议(ITU-R BT.1201)ITU-R BT.1201 建议书提出了超高清晰度成像(HRI)格式和规范建议。该建议的提出主要考虑到如下因素:(1)超高清晰度图像能够在诸如计算机图形、印刷、医疗、电影及电视等领域里作为未来的图像系统使用;(2)世界各国正在进行有关超高清晰度图像的研究和应用试验;(3)为了经济地实现超高清晰度图像系统,应该建立世界通用标准;(4)超高清晰度图像信号传送时,数据压缩技术起着重要作用。HRI典型空间分辨率的级别的建议如表5.1.3所示。第5章视
12、频压缩编码标准 第5章视频压缩编码标准 4.我国制定的我国制定的AVS标准标准我国是ISO/IEC组织的正式成员国,国家信标委下属的多媒体分委员会与ISO/IEC JTC1/SC29直接对口。从2000年5月开始,我国科研单位开始跟踪并参与JVT标准的制定工作,目前已有多项技术提案递交到JVT标准,有些技术已经被JVT标准所接收。基于我国专家多年参与MPEG国际标准制定的经验,2002年6月成立的“数字音/视频编、解码技术标准工作组”联合国内从事数字音/视频编、解码技术研发的科研机构和企业,提出了我国自主的数字音/视频编、解码技术标准AVS(Audio Video coding Standar
13、d)。于2003年年底完成的AVS 1.0标准具有四个特点:(1)性能高,在性能上比最新的国际标准H.264略高,比MPEG-2高两倍以上;第5章视频压缩编码标准(2)复杂度低,算法的复杂度比H.264低;(3)实现成本低,软件和硬件实现成本都比H.264低;(4)专利授权费用低。AVS工作组希望以此技术标准为契机,提高我国音/视频芯片、整机和软/硬件系统的核心竞争力,为我国数字电视等AV产业的跨越式发展提供重要的技术支撑。第5章视频压缩编码标准 5.2 H.261标准标准1984年国际电报电话咨询委员会的第15研究组建立了一个专家组专门研究电视电话的编码问题,所用的电话网络为综合业务数据网络
14、ISDN,当时的目标是推荐一个图像编码标准,其传输速率为m384 kb/s,m=1,2,3,4,5。这里384 kb/s在ISDN中称为H0通道。另有基本通道B的速率为64 kb/s,6B384 kb/s。5H0=30B=1920 kb/s为窄带ISBN的最高速率。后来因为以384 kb/s速率作为起始点偏高,广泛性受限制,另外跨度也太大,灵活性受影响,所以改为P64 kb/s,P=1,2,30。最后又把P扩展到32,因为3264 kb/s=2084kb/s,其中2084=211,基本上等于2 Mb/s,实际上已超过了窄带ISDN的最高速率1920 kb/s,最高速率也称通道容量。经过5年以上
15、的精心研究和努力,终于在1990年12月完成和批准了CCITT推荐书H.261,即“采用P64 kb/s的声像业务的图像编解码”,H.261简称P64。第5章视频压缩编码标准 由于H.261标准是用于电视电话和电视会议,因此推荐的图像编码算法必须是实时处理的,并且要求最小的延迟时间(因为图像必须和语音密切配合,否则必须延迟语音时间)。当P取1或2时,速率只能达到128 kb/s,由于速率较低,只能传清晰度不太高的图像,因此适合于面对面的电视电话。当P6时,速率大于或等于384 kb/s,则速率较高,可以传输清晰度尚好的图像,所以适用于电视会议。第5章视频压缩编码标准 5.2.1 图像格式图像格
16、式图像纵横比和每帧图像的纵、横像素数是图像的基本格式,并且由此可以推算像素的纵横比。为了使现行各种电视制式,即PAL、NTSC、SECAM制的图像比较容易地转换为电视电话的图像格式,从而便于相互交换,并且速率又较低,H.261采用通用中间格式CIF。CIF规定图像亮度分量Y的横向像素为352个,纵向像素为288个。图像色度分量Cb、Cr的纵、横像素数均为亮度分量的一半。另外,图像尺寸的纵横比为3 4,与常规模拟电视屏幕尺寸比例一致。由此可以推算像素的纵横比为像素纵横比=纵:横=34:11:12288 352第5章视频压缩编码标准 可见,像素纵横比为11 12,接近于方形。亮度分量Y的像素数为色
17、度分量Cb或Cr像素数的4倍,而Y分量像素的面积等于色度分量Cb或Cr像素的面积,可见,色度分量的清晰度比亮度分量的清晰度低,这对整个图像清晰度基本无影响,因为人眼对色度的分辨率本来就低,所以可以利用这种心理视觉冗余度来减少色度像素数。第5章视频压缩编码标准 亮度分量的纵向像素为288个,实际上相当于288行扫描线,这是考虑到当前两种电视制式为625行25帧和525行30帧,都是隔行扫描和每帧为2场,所以两种制式的场扫描行数为6252和5252,而288扫描行就是由这两种场扫描行数转换来的,即取这两种场扫描行数的平均值:(5.2.1)这样比较容易实现CIF与这两种电视制式之间的相互转换。625
18、52522287.52882第5章视频压缩编码标准 由于编码时采用88像素块作为基本单元,因此图像的纵、横像素数均应是8的整数倍,即352844,288836,176822,1448=18,所以亮度分量和色度分量的88块数分别应为4436,2218,即亮度分量的块数为各色度分量块数的4倍,故四个亮度分量块和两个色度分量块共六块反映的是同一个像区,可以组成一组,称之为宏块,用MB表示,这样有利于一起编码。第5章视频压缩编码标准 将每行模拟亮度信号转换成数字信号时,需要对亮度信号抽样,考虑到纵向清晰度为288行,比较低,所以横向清晰度也不需要比纵向清晰度高,故将抽样频率定为 6.75 MHz。对于
19、625行25帧制式,其行频为6252515 625 Hz,抽样频率为行频的432倍,即 6.75 MHz15 625432 Hz。对于525行30帧制式,实际上是30 0001001帧,接近于29.97 帧,其行频为52530 000/100115 734.266 Hz,抽样频率为行频的429倍,即下式成立:(5.2.2)300006.75MHz429 525Hz1001第5章视频压缩编码标准 抽样频率取为电视制式的行频的整数倍,有利于长时间连续抽样时纵、横像素同步,同时抽样频率也比较容易发生。另外,色度信号的抽样频率为亮度信号抽样频率的一半,即3.375 MHz。对于625行25帧制式,行周
20、期为64 s,其中显示区时间约为54 s,所以显示区像素数为显示区像素数=(5.2.3)从显示区中同步地取出352个像素即可。显示区时间抽样周期54s=54 6.75=364.516.75MHz第5章视频压缩编码标准 对于525行30帧制式,行周期为63.555 s,其中显示区时间约为53 s,所以显示区像素数为显示区像素数53 s6.75 MHz357.75同样地,从显示区中同步地取出352个像素即可。当电视电话在ISDN网中传输时,若P取1或2,则最高速率为128 kb/s,上述CIF规定的像素仍然太多,因此取CIF规定的纵、横像素数的一半,称为QCIF(其中Q为Quarter,即1/4)
21、,此时亮度信号的横向像素数为176,纵向像素数为144。色度信号Cb、Cr的横向像素数为88,纵向像素数为72。第5章视频压缩编码标准 QCIF规格为最低要求,所有电视电话都应该达到此规格,而CIF规格则为任选。在像素数减少的同时,显示面积也相应减少,例如取图像屏幕对角线长34英寸为宜。一些厂家采用QCIF格式在现行电话网中传输电视电话,由于现行电话网可以传输的速率在20 kb/s以下,远比64 kb/s低,因此要采取降低帧频等措施。在ISDN中传输电视电话和电视会议时帧频应取30 Hz。综上所述,H.261标准的图像格式如表5.2.1所示。第5章视频压缩编码标准 第5章视频压缩编码标准 另按
22、CCIR-601规定量化后色度信号峰峰值为224等级电平,最低电平为16,最高电平为240,亮度信号Y量化后的电平有220级电平,亮度信号最高电平为235,最低电平(黑电平)为16,其亮度信号和色差信号的码电平分配见第1章。第5章视频压缩编码标准 下面举例说明图像压缩比CR的计算方法。例例5.2.1 若采用CIF图像格式,帧频取30帧/秒,求在速率为384 kb/s的网络中传输时应有的压缩比CR。解解 压缩前的速率为352288+2(176144)像素/帧30帧/秒8位/像素=36495.36kb/sCR=(5.2.4)此压缩比较高,需要采用较多措施后才能达到。上面的例子采用简化的计算方法,在
23、实际编码时要加入辅助信息,使应有的压缩比更高些。压缩前速率压缩后速率36495.36kbit/s=95.04384kbit/s第5章视频压缩编码标准 5.2.2 信源编码器方框图信源编码器方框图图5.2.1所示为信源编码器方框图。图中图像输入实际上是以宏块MB为单位输入的,MB中包含亮度信号Y的4个88像素方块,色度信号Cb、Cr的各一个88像素方块,共6个88像素方块。下面分段讨论信源编码器方框图。图5.2.1与第4章的图 4.1.3 实质上完全一样,只不过这里更细化了。第5章视频压缩编码标准 图 5.2.1 信源编码器方框第5章视频压缩编码标准 1.帧内、帧间编码模式帧内、帧间编码模式 电
24、视电话的帧频为30帧/秒。相邻帧由于其内容渐变而有很强的相关性,所以允许每两帧传送图像之间可以有3帧不传。每次场景更换后,第1帧一定要传,所以要对第1帧进行帧内编码,所传的这帧称为帧内帧,用I(即Intraframe的缩写)表示。图5.2.2中的第5帧为预测帧,用P表示,它是由第1帧和第5帧本身经过预测编码而得的。P帧本身也可以作为下一个P帧预测编码的基础。图5.2.2中的B帧称为双向内插帧,它是由邻近的I、P帧或P、P帧计算所得的。由此可知,I帧和P帧是产生全部B帧的基础。通常每12帧或15帧图像中传1帧I帧,每3帧或4帧图像中传1帧P帧。换场景后第1帧为I帧。第5章视频压缩编码标准 图5.
25、2.2中计算第2帧(B)中每个像素时,可用公式,计算第3帧(B)时,可用公式 ,依次类推可得其它B帧的计算公式。上述形成P帧和B帧的方法均称为帧间编码。图5.2.1中左侧的两个单刀双掷开关由编码控制器(CC)控制,用于帧内、帧间编码选择,图示为帧间编码,当开关指向上方时为帧内编码。31B=I+P441B=I+P2第5章视频压缩编码标准 图 5.2.2 帧内、帧间编码模式计算第5章视频压缩编码标准 2.DCT变换变换 图5.2.1中方框T为变换,实际上当前都用离散余弦变换(DCT)将二维空间像素值变换成二维空间频域系数,通常88像素块作为基本变换单元,每一像素用8 bit量化后,在0255级电平
展开阅读全文