第六章多媒体数据压缩教材课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第六章多媒体数据压缩教材课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 多媒体 数据压缩 教材 课件
- 资源描述:
-
1、2022-12-71多媒体技术多媒体技术22022-12-7第第6章章 多媒体数据压缩多媒体数据压缩常用的无损数据压缩方法常用的无损数据压缩方法6.3常用的有损数据压缩方法常用的有损数据压缩方法6.4多媒体数据压缩概述多媒体数据压缩概述 6.1数据压缩的技术基础数据压缩的技术基础 6.232022-12-76.1 多媒体数据压缩概述多媒体数据压缩概述v6.1.1 多媒体数据压缩的必要性多媒体数据压缩的必要性 原始采样的媒体数据量巨大原始采样的媒体数据量巨大 有效利用存储器存储容量有效利用存储器存储容量 提高通信线路的传输效率提高通信线路的传输效率 消除计算机系统处理视频消除计算机系统处理视频I
2、/O瓶颈瓶颈42022-12-76.1 多媒体数据压缩概述多媒体数据压缩概述v6.1.2 多媒体数据压缩的可能性多媒体数据压缩的可能性 常见的图像数据冗余种类:常见的图像数据冗余种类:空间冗余空间冗余 时间冗余时间冗余 结构冗余结构冗余 知识冗余知识冗余 视觉冗余视觉冗余52022-12-7空间冗余空间冗余v在任何一幅图像中,均有由许多在任何一幅图像中,均有由许多灰度或颜灰度或颜色色都相同的邻近像素组成的区域,它们形都相同的邻近像素组成的区域,它们形成了一个性质相同的集合块,即它们相互成了一个性质相同的集合块,即它们相互之间具有空间上的强相关性,在图像中就之间具有空间上的强相关性,在图像中就表
3、现为空间冗余。表现为空间冗余。例如,一块表面颜色均匀的区域中所有点的光强和色彩以及饱和度都是相同的,这就是空间冗余。62022-12-7时间冗余时间冗余v这是序列图像(电视图像、运动图像)表这是序列图像(电视图像、运动图像)表示中经常包含的冗余。图像示中经常包含的冗余。图像序列中两幅相序列中两幅相邻的图像有较大的相关邻的图像有较大的相关,这反映为时间冗,这反映为时间冗余。余。运动图像的相邻帧往往包含相同的背景和移动物体,只不过物体所在的位置略有不同,由于相邻帧记录了相邻时刻的同一场景,所以称为时间冗余。72022-12-7结构冗余结构冗余v在有些图像的纹理区,在有些图像的纹理区,图像的像素值图
4、像的像素值存在存在着明显的分布模式。着明显的分布模式。例如,方格状的板图案等,我们称此为结构冗例如,方格状的板图案等,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图余。已知分布模式,可以通过某一过程生成图像。像。82022-12-7知识冗余知识冗余v有些有些图像的理解与某些知识图像的理解与某些知识有相当大的有相当大的相相关关性。例如:狗的图像有固定的结构,狗性。例如:狗的图像有固定的结构,狗有四条腿,头部有眼、鼻、耳朵,有尾巴有四条腿,头部有眼、鼻、耳朵,有尾巴等。这类规律性的结构可由先验知识和背等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。景知识得到,我
5、们称此类冗余为知识冗余。92022-12-7视觉冗余视觉冗余v人类的视觉系统对图像场的人类的视觉系统对图像场的敏感度敏感度是非均是非均匀的。但是,在记录原始的图像数据时,匀的。但是,在记录原始的图像数据时,通常假定视觉系统近似线性的和均匀的,通常假定视觉系统近似线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从对视觉敏感和不敏感的部分同等对待,从而产生比理想编码(即把视觉敏感和不敏而产生比理想编码(即把视觉敏感和不敏感的部分区分开来的编码)更多的数据,感的部分区分开来的编码)更多的数据,这就是视觉冗余。这就是视觉冗余。人类视觉系统的一般分辨能力估计为人类视觉系统的一般分辨能力估计为26灰度灰
6、度等等级,而一般图像的量化采用的是级,而一般图像的量化采用的是28的灰度的灰度等级。等级。这也被称之为视觉冗余。这也被称之为视觉冗余。102022-12-76.1 多媒体数据压缩概述多媒体数据压缩概述v6.1.3 多媒体数据压缩的原理多媒体数据压缩的原理v1.1.图像数据压缩的主要依据有两个图像数据压缩的主要依据有两个 一是图像数据中有许多一是图像数据中有许多重复的数据重复的数据,使用数学,使用数学方法来表示这些重复数据就可以减少数据量;方法来表示这些重复数据就可以减少数据量;另一个依据是另一个依据是人眼睛对图像细节和颜色的辨认人眼睛对图像细节和颜色的辨认有一个有一个极限极限,把超过极限的部分
7、去掉,这也就,把超过极限的部分去掉,这也就达到了数据压缩的目的。达到了数据压缩的目的。基于数据冗余基于数据冗余的压缩技术是的压缩技术是无损压缩技术无损压缩技术基于人眼视觉特基于人眼视觉特性的压缩技术是性的压缩技术是有损压缩技术有损压缩技术112022-12-76.1.3 多媒体数据压缩的原理多媒体数据压缩的原理v2.图像压缩说明图像压缩说明 视频压缩与语音相比,语音的数据量较小,且视频压缩与语音相比,语音的数据量较小,且基本压缩方法已经成熟,目前的数据压缩研究基本压缩方法已经成熟,目前的数据压缩研究主要集中于图像和视频信号的压缩方面。主要集中于图像和视频信号的压缩方面。压缩处理过程有两个过程,
8、编码过程是将原始压缩处理过程有两个过程,编码过程是将原始数据经过编码进行压缩,以便存储与传输;解数据经过编码进行压缩,以便存储与传输;解码过程是对编码数据进行解码,还原为可以使码过程是对编码数据进行解码,还原为可以使用的数据。用的数据。122022-12-76.1.3 多媒体数据压缩的原理多媒体数据压缩的原理v3.与压缩相关的指标与压缩相关的指标 衡量一种数据压缩技术的好坏有四个重要的指衡量一种数据压缩技术的好坏有四个重要的指标:标:压缩比大:即压缩前后所需要的信息存储量之比压缩比大:即压缩前后所需要的信息存储量之比要大。要大。算法简单:实现压缩的算法简单,压缩、解压速算法简单:实现压缩的算法
9、简单,压缩、解压速度快,尽可能地做到实时压缩解压。度快,尽可能地做到实时压缩解压。恢复效果好:恢复效果好,要尽可能地恢复原始恢复效果好:恢复效果好,要尽可能地恢复原始数据。数据。压缩能否用硬件实现。压缩能否用硬件实现。132022-12-76.1.3 多媒体数据压缩的原理多媒体数据压缩的原理142022-12-76.1.3 多媒体数据压缩的原理多媒体数据压缩的原理v 冗余压缩法冗余压缩法 也称无损压缩法,是指使用压缩后的数据可以也称无损压缩法,是指使用压缩后的数据可以解压缩,且解压之后的数据与原来的数据完全解压缩,且解压之后的数据与原来的数据完全相同。它利用数据的统计冗余进行压缩,可完相同。它
10、利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率全恢复原始数据而不引入任何失真,但压缩率受到数据统计冗余度的理论限制,一般为受到数据统计冗余度的理论限制,一般为2:1到到5:1。152022-12-76.1.3 多媒体数据压缩的原理多媒体数据压缩的原理v 熵压缩法熵压缩法 也称有损压缩法,有失真压缩,是指使用压缩也称有损压缩法,有失真压缩,是指使用压缩后的数据进行解压缩,解压之后的数据与原来后的数据进行解压缩,解压之后的数据与原来的数据有所不同,但不会让人对原始资料表达的数据有所不同,但不会让人对原始资料表达的信息造成误解。的信息造成误解。162022-12-76.1.
11、3 多媒体数据压缩的原理多媒体数据压缩的原理v 熵压缩法与冗余压缩法的比较熵压缩法与冗余压缩法的比较 在图像压缩系统组成中,变换和编码是无损耗在图像压缩系统组成中,变换和编码是无损耗的,而量化是有损耗的。无损压缩方法仅利用的,而量化是有损耗的。无损压缩方法仅利用了统计冗余,而没有利用量化器。有损压缩方了统计冗余,而没有利用量化器。有损压缩方法既利用了统计冗余又采用了量化器,利用了法既利用了统计冗余又采用了量化器,利用了心理视觉冗余。心理视觉冗余。172022-12-76.1.4 数据压缩方法的分类数据压缩方法的分类v1.根据编、解码后数据根据编、解码后数据是否一致是否一致来进行分来进行分类,数
12、据压缩的方法一般被划分为两类:类,数据压缩的方法一般被划分为两类:可逆编码(无损编码)可逆编码(无损编码)。此种方法的解码图像。此种方法的解码图像与原始图像严格相同,压缩比大约在与原始图像严格相同,压缩比大约在2:15:1之之间。主要编码有间。主要编码有Huffman编码编码、算术编码算术编码、行行程长度编码程长度编码等。等。不可逆编码(有损编码)不可逆编码(有损编码)。此种方法的解码图。此种方法的解码图像与原始图像存在一定的误差,但视觉效果一像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍调节。般可以接受,压缩比可以从几倍到上百倍调节。常用的编码有常用的编码有变换
13、编码变换编码和和预测编码预测编码。182022-12-76.1.4 数据压缩方法的分类数据压缩方法的分类v2.根据压缩方法的原理,可将其具体划分根据压缩方法的原理,可将其具体划分为以下几种:为以下几种:量化与向量量化编码量化与向量量化编码 预测编码预测编码 变换编码变换编码 信息熵编码信息熵编码 混合编码混合编码 变换编码与预测编码相结合变换编码与预测编码相结合192022-12-7量化与向量量化编码量化与向量量化编码v对像元点进行量化时,除了每次仅量化一对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为向量量化。
14、即利点的做法,这种方法称为向量量化。即利用相邻数据间的相关性,将数据系列分组用相邻数据间的相关性,将数据系列分组进行量化。进行量化。202022-12-7预测编码预测编码v预测编码预测编码 预测编码是根据离散信号之间存在着一定关联预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以就会很小。在同等精度要求的条件下,就可以用比较少的
15、比特进行编码,达到压缩数据的目用比较少的比特进行编码,达到压缩数据的目的。的。如:增量调制(如:增量调制(DM)、差分脉冲编码调制)、差分脉冲编码调制(DPCM)、自适应增量调制()、自适应增量调制(ADPCM)等。)等。主要用于声音编码。主要用于声音编码。212022-12-7变换编码变换编码v变换编码变换编码 将图像将图像时域信号转换为频域信号时域信号转换为频域信号进行处理。数进行处理。数据处理时可以将主要的注意力集中在相对较小据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩。的区域,从而实现数据压缩。一般采用正交变换,如:离散余弦变换(一般采用正交变换,如:离散余弦变换(
16、DCT)、)、离散傅立叶变换(离散傅立叶变换(DFT)222022-12-7信息熵编码信息熵编码v信息熵原理信息熵原理 让出现概率大的信号用较短的码字表示,反之让出现概率大的信号用较短的码字表示,反之用较长的码字表示。用较长的码字表示。v常见的编码方法常见的编码方法 Huffman编码编码 Shannon编码编码 算术编码算术编码232022-12-76.2 数据压缩的技术基础数据压缩的技术基础v6.2.1 熵的概念熵的概念 表示一条信息中真正需要编码的信息量,即数表示一条信息中真正需要编码的信息量,即数据压缩的理论极限。据压缩的理论极限。对于任何一种无损数据压缩,最终的数据量一对于任何一种无
17、损数据压缩,最终的数据量一定大于信息熵,数据量越接近于熵值,说明其定大于信息熵,数据量越接近于熵值,说明其压缩效果越好。压缩效果越好。242022-12-76.2 数据压缩的技术基础数据压缩的技术基础v6.2.2 信息熵的计算信息熵的计算 1.信息量信息量 信息量是指从信息量是指从N个等概率事件中选出一个事件所需个等概率事件中选出一个事件所需要的信息含量。要的信息含量。设从设从N个数中选定任一个数个数中选定任一个数xj的概率为的概率为p(xj),假定选,假定选定任意一个数的概率都相等,即定任意一个数的概率都相等,即p(xj)1/N,因此定,因此定义信息量如下:义信息量如下:)()(log1lo
18、glog)(222jjjxpIxpNNxI概率相等概率相等概率不等概率不等252022-12-76.2.2 信息熵的计算信息熵的计算v2.信息熵信息熵:平均信息量平均信息量 信源信源X发出的发出的xj(j=1,2,n)共共n个随机事件,个随机事件,每个事件产生的平均信息量为:每个事件产生的平均信息量为:H(X)称为信源称为信源X的的“熵熵”,即信源,即信源X发出任意发出任意一个随机变量的平均信息量。一个随机变量的平均信息量。其中:等概率事件的熵最大,假设有其中:等概率事件的熵最大,假设有N个事件,则个事件,则此时熵为:此时熵为:njjjjxPxPxIEXH12)(log)()()(NNNXHN
19、j221log1log1)(最大熵最大熵概率概率信息量信息量262022-12-76.2.3 信息熵的范围信息熵的范围v当当P(x1)1时,时,P(x2)P(x3)P(xj)0,则此时熵为:则此时熵为:v由上可得熵的范围为:由上可得熵的范围为:0)(log)()(121xPxPXHNXH2log)(0最小熵最小熵272022-12-76.2.4 平均码长平均码长v在编码中用在编码中用熵值熵值来衡量是否为最佳编码。若来衡量是否为最佳编码。若以以Lc表示编码器输出码字的平均码长,则当表示编码器输出码字的平均码长,则当 LcH(X)有冗余,不是最佳。有冗余,不是最佳。LcH(X)不可能。不可能。Lc
20、H(X)最佳编码(最佳编码(Lc稍大于稍大于H(X))。)。熵值为平均码长熵值为平均码长Lc的下限。的下限。v平均码长平均码长Lc的计算公式为:的计算公式为:njjjcxLxPL1)()((j=1,2,n)其中:其中:P(xj)是信源是信源X发出发出xj的概率,的概率,L(xj)为为xj的编码长。的编码长。282022-12-76.2.5 冗余度、编码效率与压缩比冗余度、编码效率与压缩比 v在数字图像通信系统中,在数字图像通信系统中,冗余度冗余度、编码效编码效率率与与压缩比压缩比是是衡量信源特性衡量信源特性以及以及编解码设编解码设备性能备性能的重要指标。的重要指标。设原图像的平均码长为设原图像
21、的平均码长为L,熵为熵为H(X),压缩后压缩后图像的平均码长为图像的平均码长为Lc,则编码效率为:则编码效率为:冗余度为:冗余度为:1-压缩比为:压缩比为:1)(XHLRRLXH11)(cLLC LcRLXH11)(292022-12-76.3 常用的无损数据压缩方法常用的无损数据压缩方法v6.3.1 Huffman编码编码v6.3.2 算术编码算术编码v6.3.3 行程行程RLE编码编码v6.3.4 词典编码词典编码302022-12-76.3.1 Huffman编码编码v基本原理基本原理 依据信源字符出现的概率大小来构造代码,对依据信源字符出现的概率大小来构造代码,对出现概率较大出现概率较
22、大的信源字符,的信源字符,给予较短码长给予较短码长,而,而对于对于出现概率较小出现概率较小的信源字符,给予的信源字符,给予较长的码较长的码长长,最后使得编码的平均码字最短。,最后使得编码的平均码字最短。312022-12-76.3.1 Huffman编码编码v具体的编码步骤具体的编码步骤 将信源出现的概率由大到小排序。将信源出现的概率由大到小排序。将两处最小概率组合相加,形成新概率。将两处最小概率组合相加,形成新概率。将新概率与未编码的字符一起重新排序。将新概率与未编码的字符一起重新排序。重复步骤重复步骤2、3,直到出现的概率和为,直到出现的概率和为1。分配代码分配代码 代码分配从最后一步开始
23、反向进行,对最后两个概代码分配从最后一步开始反向进行,对最后两个概率率一个赋予一个赋予0代码,一个赋予代码,一个赋予1代码代码。记录下从树的。记录下从树的根到每个信源符号终节点的根到每个信源符号终节点的0和和1序列。序列。至于哪个为至于哪个为“1”哪个哪个为为“0”则无关紧要,则无关紧要,最后的结果仅仅是分最后的结果仅仅是分配的代码不同,而代配的代码不同,而代码的平均长度是相同码的平均长度是相同的。的。322022-12-76.3.1 Huffman编码编码vHuffman编码中求平均码长的方法:编码中求平均码长的方法:概率概率码长码长332022-12-76.3.1 Huffman编码编码v
24、Huffman编码练习一编码练习一:设输入图像的灰度级设输入图像的灰度级a1,a2,a3,a4,a5,a6出现的出现的概率分别是概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算试进行哈夫曼编码,并计算平均码字长度平均码字长度。342022-12-76.3.1 Huffman编码编码vHuffman编码练习二编码练习二:信源符号的概率如下,请按要求作答:信源符号的概率如下,请按要求作答:画出其画出其Huffman编码的编码树编码的编码树 给出各信源符号的码字与码长给出各信源符号的码字与码长 计算该信源的平均码长。计算该信源的平均码长。(说明:大概率符号赋予
25、(说明:大概率符号赋予0,小概率符号赋予,小概率符号赋予l,相,相同概率情况下上面的是同概率情况下上面的是0,下面的是,下面的是1。)。)XX1X2X3X4X5X6P(X)0.35 0.25 0.200.10.05 0.05352022-12-7Huffman编码练习一答案编码练习一答案最终编码结果为:最终编码结果为:a1=1,a2=011,a3=001,a4=010,a5=0001,a6=00001010010362022-12-7Huffman编码练习一答案编码练习一答案v据公式图像信源熵为:据公式图像信源熵为:H(X)=-(0.4log20.4+0.2log20.2+0.12log20.
展开阅读全文