图像压缩编码课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《图像压缩编码课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 压缩 编码 课件
- 资源描述:
-
1、2023-1-27第四章第四章 图像压缩编码图像压缩编码 2023-1-274.1 4.1 概述概述 4.1.1 4.1.1 视频压缩编码的必要性视频压缩编码的必要性 现以一路电视信号为例,看看将它数字化后 的 数 码 率,按 C C I R(C o n s u l t a t i v e Committee International Radio)制定的CCIR601标准,数字化后的分辨率为720576,每秒25帧,Y:U:V为4:2:2,若以8bit表示Y信号,则每像素占16bit,数码率为165.9Mbps。以64kbps作为一个数字话路,若不加压缩,为传输一路电视要占用2592个有效数
2、字话路。这在实际应用中是难以接受的。2023-1-27 若用一个容量为1GB的硬盘或CDROM来存贮这样的数据,则只能存贮不到1分钟的图像,并且,所需的高数据呑吐率是一般的硬盘和CDROM难以达到的。若不加压缩,HDTV信号的数码率可接近1Gbps,更加惊人。再以指纹库为例,若以(512512)8bit的灰度图像来存贮一个手指的指纹,一个40万人的指纹库,每人十指,则共需1000GB的存贮量。由这些例子就可以看出图像压缩编码的必要性。2023-1-27 图像编码技术的进展已使这些制约因素不再成为瓶颈,从而推动了各类图像通信系统的推广和应用。图像编码是各类图像信息传输、存贮产品的一项核心技术。2
3、023-1-274.1.2 4.1.2 图像压缩编码的目的图像压缩编码的目的 图像编码是一种信源编码,其信源是各种类型的图像信息。图像压缩编码的目的是以尽量少的比特数表征图像,同时保持复原图像的质量,使它符合预定应用场合的要求。节省图像存储器的容量、减少信道容量、缩短图像处理时间。但这是以压缩和解压的时间为代价的。2023-1-274.1.3 4.1.3 图像压缩编码的可行性图像压缩编码的可行性 图像数据可以进行压缩有几个方面的原因。首先,原始图像数据是高度相关相关的,存在很大的冗余度冗余度。数据冗余造成比特数浪费,消除这些冗余可以节约码字,也就达到了数据压缩的目的。2023-1-271)1)
4、空间冗余度空间冗余度:大多数图像内相邻像素:大多数图像内相邻像素之间有较大的相关性。之间有较大的相关性。2)2)时间冗余度时间冗余度:序列图像前后帧之间的:序列图像前后帧之间的较大的相关性。较大的相关性。3)3)频率域冗余度频率域冗余度:多光谱遥感图像各谱:多光谱遥感图像各谱间有相关性。间有相关性。2023-1-274)4)符号冗余度符号冗余度:若用相同码长表示不:若用相同码长表示不同出现概率的符号也会造成比特数的浪同出现概率的符号也会造成比特数的浪费,这种浪费称为符号冗余度。如果采费,这种浪费称为符号冗余度。如果采用可变长编码技术,对出现概率高的符用可变长编码技术,对出现概率高的符号用短码字
5、表示,对出现概率低的符号号用短码字表示,对出现概率低的符号用长码字,就可消除符号冗余度,从而用长码字,就可消除符号冗余度,从而节约码字。节约码字。2023-1-275)5)视觉冗余度视觉冗余度:允许图像编码有一定:允许图像编码有一定的失真也是图像可以压缩的一个重要原的失真也是图像可以压缩的一个重要原因。在许多应用场合,并不要求经压缩因。在许多应用场合,并不要求经压缩及复原以后的图像和原图像完全相同,及复原以后的图像和原图像完全相同,而允许有少量失真。只要这些失真并不而允许有少量失真。只要这些失真并不被人眼所察觉,在许多情况下是完全可被人眼所察觉,在许多情况下是完全可以接受的。这种有失真的编码提
6、供了十以接受的。这种有失真的编码提供了十分有利的条件。分有利的条件。2023-1-276)6)知识冗余度知识冗余度:在某些特定的应用场合,:在某些特定的应用场合,编码对象的某些特性可预先知道。例如,编码对象的某些特性可预先知道。例如,在可视电话中,编码对象为人的头肩像。在可视电话中,编码对象为人的头肩像。这时,可以利用对编码对象的先验知识为这时,可以利用对编码对象的先验知识为编码对象建立模型。通过提取模型参数,编码对象建立模型。通过提取模型参数,对参数进行编码而不对图像直接进行编码,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。这是模型编码可以达到非常高的压缩比。这是模型编码的
7、基本思想。的基本思想。2023-1-27 图像编码技术就是要把种种压缩的可能性图像编码技术就是要把种种压缩的可能性变为现实。变为现实。2023-1-274.1.4 4.1.4 图像压缩编码一般框图图像压缩编码一般框图 图像编码的过程可以概括成图图像编码的过程可以概括成图1 1所示的所示的三个步骤,原始图像经映射变换后的数据三个步骤,原始图像经映射变换后的数据,经量化器和熵编码器成为码流输出。经量化器和熵编码器成为码流输出。映射变换量化器熵编码器信道反映射变换反量化器熵解码器映射后数据量化后数据码流C复原的量化后图像复原的映射后数据原始图像f(m,n)复原图像f(m,n)码流C图1图像压缩编码的
8、一般框图2023-1-271)1)映射变换映射变换 映射变换是图像编码的一个核心部分,映射变换是图像编码的一个核心部分,它决定了量化和编码的对象类型,所以可以它决定了量化和编码的对象类型,所以可以据此对编码方法进行分类。据此对编码方法进行分类。映射变换目的是通过映射改变图像数据映射变换目的是通过映射改变图像数据的特性,使之更有利于压缩编码。的特性,使之更有利于压缩编码。2023-1-27 这样做的一般优于直接对原图像进行这样做的一般优于直接对原图像进行量化编码。因为图像数据在相邻像素间有量化编码。因为图像数据在相邻像素间有较大的相关性,不管原图像明暗如何,相较大的相关性,不管原图像明暗如何,相
9、邻像素灰度差总是分布在零附近。进一步邻像素灰度差总是分布在零附近。进一步的统计表明,差值信号的分布接近拉普拉的统计表明,差值信号的分布接近拉普拉斯分布,其标准差比原始图像的标准差要斯分布,其标准差比原始图像的标准差要小的多,因而对它进行量化编码所需的比小的多,因而对它进行量化编码所需的比特数就较少。实际上,求差值的过程减少特数就较少。实际上,求差值的过程减少了相邻像素间的相关性,从而减少了冗余了相邻像素间的相关性,从而减少了冗余度,因此可以实现压缩。度,因此可以实现压缩。2023-1-27 在实际应用中,映射变换的方法种类在实际应用中,映射变换的方法种类繁多,还可以更复杂。如在变换编码中,繁多
10、,还可以更复杂。如在变换编码中,先将图像分成若干个先将图像分成若干个n nn n大小的子块,然大小的子块,然后进行映射变换。在这种情况下的映射变后进行映射变换。在这种情况下的映射变换是对各子块进行某种正交变换。而量化换是对各子块进行某种正交变换。而量化和编码是对变换后所得系数进行的。和编码是对变换后所得系数进行的。2023-1-27 2)2)量化器量化器 在限失真编码中要对映射后的数据进行量化。在限失真编码中要对映射后的数据进行量化。若量化是对映射后的数据逐个地进行的,则称标若量化是对映射后的数据逐个地进行的,则称标量量化;若量化是成组地进行的,则称为矢量量量量化;若量化是成组地进行的,则称为
11、矢量量化。化。量化器的引入是图像编码产生量化器的引入是图像编码产生失真的根源失真的根源。量。量化总是会造成某些信息丢失,形成失真,即量化化总是会造成某些信息丢失,形成失真,即量化失真或量化噪声。为使失真小,应量化精细,但失真或量化噪声。为使失真小,应量化精细,但压缩比就高不了。这是一对矛盾,应选用恰当的压缩比就高不了。这是一对矛盾,应选用恰当的量化级数和量化曲线形状来缓解矛盾。量化级数和量化曲线形状来缓解矛盾。2023-1-27 值得注意的是,对于同样的量化失真,值得注意的是,对于同样的量化失真,由不同的映射变换与反变换会引起不同性质由不同的映射变换与反变换会引起不同性质的复原图像的失真,人眼
12、对某些性质的失真的复原图像的失真,人眼对某些性质的失真敏感而对另一些性质的失真不敏感。敏感而对另一些性质的失真不敏感。2023-1-273)3)熵编码器熵编码器 这一步是用来这一步是用来消除符号编码冗余度消除符号编码冗余度的。的。它一般不产生失真。理想的情况是使编出的码它一般不产生失真。理想的情况是使编出的码流的平均码长等于量化后的数据的信息熵。常流的平均码长等于量化后的数据的信息熵。常用的编码方法有许多种,例如分组码:行程码用的编码方法有许多种,例如分组码:行程码(RLCRLC)和变长码()和变长码(VLCVLC);不分组码:算术码。);不分组码:算术码。行程码传输的是数据块行程的长度而不是
13、行程码传输的是数据块行程的长度而不是数据本身。例如要传数据本身。例如要传200200个个0 0,用行程码时改为,用行程码时改为传行程码标记和行程长度值传行程码标记和行程长度值“200”200”。2023-1-27 在 变 长 码 中 最 常 用 的 是 霍 夫 曼在 变 长 码 中 最 常 用 的 是 霍 夫 曼(HuffmanHuffman)码,基本原则是对出现概率大)码,基本原则是对出现概率大的数值用短码来编,对出现概率小的数值的数值用短码来编,对出现概率小的数值用长码来编,从而使平均码长减少,降低用长码来编,从而使平均码长减少,降低码率。在实际编码器中常把码率。在实际编码器中常把RCLR
14、CL和和HuffmanHuffman码结合起来,称为码结合起来,称为HuffmanHuffman行程码,在行程码,在H.261H.261,JPEGJPEG,MPEGMPEG等国际标准中就用到它。等国际标准中就用到它。而算术码则用于而算术码则用于JPEGJPEG,H.263H.263等国际标准中。等国际标准中。2023-1-274)4)上述三个步骤之间是相互联系相互制约的上述三个步骤之间是相互联系相互制约的 对有些编码方法,如预测编码或变换编码,对有些编码方法,如预测编码或变换编码,映射变换后数据量并没有减少,甚至因动态范映射变换后数据量并没有减少,甚至因动态范围的加大而使数据量略有增加。但它为
15、后两步围的加大而使数据量略有增加。但它为后两步作了准备,使它们能有效发挥作用。而在模型作了准备,使它们能有效发挥作用。而在模型编码中,经映射变换后得到的模型参数,其数编码中,经映射变换后得到的模型参数,其数据量已大大小于原始图像,即第一步已经实现据量已大大小于原始图像,即第一步已经实现了很大的压缩。后面的量化编码则是作进一步了很大的压缩。后面的量化编码则是作进一步的压缩。其情况和变换编码有很大的不同。的压缩。其情况和变换编码有很大的不同。2023-1-275)5)误码可能导致码流结构的变化,从而不能误码可能导致码流结构的变化,从而不能正确解码正确解码 如果码流在信道中传输时产生误码,就会造如果
16、码流在信道中传输时产生误码,就会造成复原图像质量的下降。有时一个比特的误码会成复原图像质量的下降。有时一个比特的误码会造成一大片复原图像的错误,这种现象称误码扩造成一大片复原图像的错误,这种现象称误码扩散现象。按信息论的观点,压缩得越多、冗余度散现象。按信息论的观点,压缩得越多、冗余度越小的码流越难抵抗误码的影响。在实用的图像越小的码流越难抵抗误码的影响。在实用的图像编码算法中必须对误码扩散提出制约条件。一个编码算法中必须对误码扩散提出制约条件。一个好的熵编码器应该有好的熵编码器应该有自同步能力自同步能力,能够在受到误,能够在受到误码影响后经过一定的码后仍能自动回到正确解码码影响后经过一定的码
17、后仍能自动回到正确解码路径上来,而不会死机或一直错下去。路径上来,而不会死机或一直错下去。2023-1-274.1.5 4.1.5 数字视频压缩编码技术数字视频压缩编码技术 数字视频压缩编码技术大致可划分为二代:数字视频压缩编码技术大致可划分为二代:以香农信息论为基础,着眼于图像信号的以香农信息论为基础,着眼于图像信号的统计统计信号特性信号特性来设计编码器的来设计编码器的波形编码方式波形编码方式,如统,如统计编码法、预测编码法、变换编码法、矢量量计编码法、预测编码法、变换编码法、矢量量化编码法、子带小波编码法、神经网络编码化编码法、子带小波编码法、神经网络编码法等,统称为第一代图像压缩编码技术
18、;而将法等,统称为第一代图像压缩编码技术;而将模型编码方式模型编码方式,如图像的轮廓纹理方法、分,如图像的轮廓纹理方法、分形基的编码方法、模型基编码等,统称为第二形基的编码方法、模型基编码等,统称为第二代图像压缩编码技术。代图像压缩编码技术。2023-1-27第一代的编码方法具有如下共同特征:第一代的编码方法具有如下共同特征:接收端得到的图像中每一像素,与原始图像中对接收端得到的图像中每一像素,与原始图像中对应的像素是相似的;应的像素是相似的;把图像分解成一些事先确定的固定大小的像素块,把图像分解成一些事先确定的固定大小的像素块,这些块的划分方法与图像内容无关,例如,这些块的划分方法与图像内容
19、无关,例如,8 88 8为一个像素块;为一个像素块;通过运动补偿(通过运动补偿(MCMC)技术减少时间冗余度,而)技术减少时间冗余度,而MCMC并不考虑图像内容的结构;并不考虑图像内容的结构;只利用了人眼视觉(只利用了人眼视觉(HVSHVS)很少一些特性。)很少一些特性。2023-1-27 由于人眼视觉系统是一种最优的图像编码由于人眼视觉系统是一种最优的图像编码系统,人眼视觉特性应该与图像中传递的本质系统,人眼视觉特性应该与图像中传递的本质特征一致,基于模型的编码方法正是基于这一特征一致,基于模型的编码方法正是基于这一思路发展而来的。思路发展而来的。19851985年正式提出了第二代图年正式提
20、出了第二代图像编码。像编码。2023-1-27从根本上讲,实行图像编码可以分成两步从根本上讲,实行图像编码可以分成两步:第一步,把图像数据变成一个消息序列;第一步,把图像数据变成一个消息序列;第二步,把码字分配给这些消息。第二步,把码字分配给这些消息。第一代方法第一代方法重点在重点在码字分配码字分配。第二代方法第二代方法则着重于图像如何表示为则着重于图像如何表示为消息序列消息序列,这时图像中被编码的实体不再是按像素或像素这时图像中被编码的实体不再是按像素或像素块(块(8 88 8或或16161616)来划分,而是)来划分,而是按其内容进按其内容进行划分行划分。此外,第二代方法还应考虑。此外,第
21、二代方法还应考虑HVSHVS,其,其码率被进一步压缩,质量仍达到人们可接收水码率被进一步压缩,质量仍达到人们可接收水平。平。2023-1-274.2 4.2 熵编码方法熵编码方法4.2.1 4.2.1 基本概念基本概念 数据量是否等于信息量数据量是否等于信息量?数据存在冗余(空间冗余、时间冗余数据存在冗余(空间冗余、时间冗余 、编码冗、编码冗余、结构冗余、知识冗余、视觉冗余等)余、结构冗余、知识冗余、视觉冗余等)信息量与数据量的关系信息量与数据量的关系 I=D-duI=D-du其中其中 I,D,duI,D,du 分别是信息量、数据量、冗余量。分别是信息量、数据量、冗余量。2023-1-27信息
22、和熵信息和熵 信息是用不确定性的量度定的。信息是用不确定性的量度定的。一个消息的可能性愈小,其信息量愈多;而消一个消息的可能性愈小,其信息量愈多;而消息的可能性愈大,其信息量愈少。息的可能性愈大,其信息量愈少。信息量是指从信息量是指从N N个相等可能事件中选出一个事个相等可能事件中选出一个事件所需要的信息度量或含量。件所需要的信息度量或含量。例如,要从例如,要从6464个数中选定某一个数,可先提问个数中选定某一个数,可先提问“是否大于是否大于3232?”在在6464个数中选定某一个数所个数中选定某一个数所需的信息量是需的信息量是 )(664log2bits2023-1-27设设:从从N N个数
23、中选定一个数个数中选定一个数x x的概率为的概率为P(x)P(x),假定,假定选定任意一个数的概率都相等,即选定任意一个数的概率都相等,即 ,因此定义信息量因此定义信息量熵:如果将信源所有可能事件的信息量进行平均,熵:如果将信源所有可能事件的信息量进行平均,就得到信息的就得到信息的“熵熵”(entropyentropy),熵就是平均熵就是平均信息量。信息量。NxP1)()()(log1loglog)(222xPIxPNNxI2023-1-271)1)图像熵图像熵(Entropy)(Entropy)熵是随机变量集合的随机性程度的度量。熵是随机变量集合的随机性程度的度量。最小随机的情况是随机变量具
24、有概率为最小随机的情况是随机变量具有概率为1 1,因,因而结果已预先知道,而结果已预先知道,H=0H=0。MKKKPPH12log2023-1-27 最大随机的情况是所有的事件是等可能性最大随机的情况是所有的事件是等可能性的。在此情况下,的。在此情况下,并且并且因此因此:对于对于M M个随机变量的熵可以处在个随机变量的熵可以处在0 0到到 的范围中。的范围中。MPPPM121MPPHMKKK212loglogM2log2023-1-27设图像像素灰度级集合为(W1,W2,WK,.,WM),其对应的概率分别为P1,P2,PK,.,PM,则熵H为 (1)熵值反映了图像的平均信息量,即图像中各个灰度
25、级比特数的统计平均值。熵的单位是位/字符(bits per symbol)。MKKKPPH12log2023-1-27 (1)式的前提条件是像素的灰度级互不相关,即为无记忆信源熵值,称为0阶熵H0(.);其含义是将一个输入序列的每一个编码所要求的平均比特数的界限。对于有记忆信源,即后续的输入不是独立的,则对每一个输入来讲,与输入序列相联系的熵小于单独输入之熵。此时,需要考虑联合概率密度函数或条件概率:(2a)(2b)MiMjjijijiWWPWWPWWH112),(log),(),(MiMjjijijiWWPWWPWWH112)/(log)/()/(2023-1-27 其含义是将两个输入序列编
展开阅读全文