数字媒体技术课件:第08章 数字媒体压缩技术.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字媒体技术课件:第08章 数字媒体压缩技术.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字媒体技术课件:第08章 数字媒体压缩技术 数字 媒体 技术 课件 08 压缩
- 资源描述:
-
1、第八章第八章 数字媒体压缩技术数字媒体压缩技术华中师范大学清华大学出版社第八章第八章 数字媒体压缩技术数字媒体压缩技术 8.18.1数据压缩及分类数据压缩及分类 8.1.18.1.1压缩的可能性与信息冗余压缩的可能性与信息冗余 8.1.28.1.2数据压缩分类数据压缩分类 8.28.2通用的数据压缩技术通用的数据压缩技术 8.2.18.2.1编码的理论基础编码的理论基础 8.2.28.2.2霍夫曼编码霍夫曼编码 8.2.38.2.3行程编码行程编码 8.2.48.2.4词典编码词典编码 8.2.58.2.5脉冲编码调制脉冲编码调制 8.2.68.2.6增量调制(增量调制(DMDM) 8.2.7
2、8.2.7差分脉冲编码调制差分脉冲编码调制第八章第八章 数字媒体压缩技术数字媒体压缩技术 8.38.3数字媒体压缩标准数字媒体压缩标准 8.3.18.3.1声音压缩标准声音压缩标准 8.3.28.3.2图像压缩标准图像压缩标准 8.3.38.3.3运动图象压缩标准运动图象压缩标准 8.3.3.1 MPEG8.3.3.1 MPEG标准标准 8.3.3.2 H.26X8.3.3.2 H.26X系列视频标准系列视频标准 8.3.3.3 AVS8.3.3.3 AVS标准标准8.1.1压缩的可能性与信息冗余 数据能够被压缩的主要原因在于媒体数据中存在数据的信息冗余。信息量包含在数据之中,一般的数据冗余主
3、要体现在: 空间冗余 结构冗余 时间冗余 视觉冗余 知识冗余 信息熵冗余 数据压缩分类数据压缩分类按信息压缩前后比较是否有损失进行划分按信息压缩前后比较是否有损失进行划分 按信息压缩前后比较是否有损失,可以划分有损压缩和无损压缩 。 无损压缩指使用压缩后的数据进行重构,重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼(Huffman)算法和LZW算法 。 有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。 按数据压缩编码的原理和方法进行划分按数据压缩编码的原理和方法进行划分 按数据压缩编码的原理和方法可划分为 统计编码,
4、主要针对无记忆信源,根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。 预测编码是利用空间中相邻数据的相关性来进行压缩数据的。 变换编码是将图像时域信号转换为频域信号进行处理。 分析合成编码是指通过对源数据的分析,将其分解成一系列更适合于表示的“基元”或从中提取若干更为本质意义的参数,编码仅对这些基本单元或特征参数进行。 按照媒体的类型进行压缩划分按照媒体的类型进行压缩划分 图像压缩标准 声音压缩标准 运动图象压缩标准 8.2通用的数据压缩技术 通用的数据压缩技术: 行程编码 字典编码 熵编码等 PCM DM DPCM 通用的压缩方法具有压缩比低、通用性强等特点 8
5、.2.1编码的理论基础 数据压缩技术的理论基础是信息论。 根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。 熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。 信息与信息量信息与信息量 信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小,其信息量愈多,反之亦然。 若pi为第i个事件的概率为0 pi 1,则该事件的信息量为 一个信源包括的所有数据叫数据量,而数据量中包含有冗余信息。 信息量 = 数据量-冗余量信息熵信息熵 信息熵就是将信源所有可能事件的信息量的平均。 设从N个数中选定任一个数xj的概率为p(
6、xj),假定选定任意一个数的概率都相等,即p(xj) 1/N,则 I(xj)log2N-log2 1/N -log2p(xj)=Ip(xj) 上式中,p(xj)是信源X发出xj的概率。I(xj)的含义是信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。 信息熵信息熵( (续续) ) 信源X发出的xj(j=1,2,n)共n个随机事件的信息量的统计平均,即 H(X)=EI(xj)= H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息量。 其中,等概率事件的熵最大,假设有N个事件,此时熵为: H(X) njjjxPxP12)(log)(NNNj1log121N2log信息
7、熵信息熵( (续续) ) 当P(x1)1时,P(x2)P(x3)P(xj)0,此时熵为 H(X) P(x1) 0 由上可得熵的范围为: 0 H(X) )(log12xPN2log信息熵信息熵( (续续) ) 在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,其计算公式为: Lc (j=1,2,n) 其中:P(xj) 是信源X发出xj的概率,L(xj)为xj的编码长。njjjxLxP1)()(信息熵信息熵( (续续) ) 平均码长与信息熵之间的关系为: LcH(X) 有冗余,不是最佳。 Lc H(X)不可能。 Lc H(X)最佳编码( Lc稍大于H(X) ) 熵值为平均码
8、长Lc的下限。8.2.2霍夫曼编码 霍夫曼编码(Huffman)是运用信息熵原理的一种无损编码方法,这种编码方法根据源数据各信号发生的概率进行编码。 在源数据中出现概率大的信号,分配的码字越短;出现概率越小的信号,其码字越长,从而达到用尽可能少的码表示源数据。 霍夫曼编码的算法 1. 初始化,根据符号概率的大小顺序对符号进行排序。2. 把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。3. 重复第2步,直到形成一个符号为止(树),其概率和等于1。4. 分配码字。码字分配从最后一步开始反向进行,即从最后两个概率开始逐渐向前进行编码,对于每次相加的两个概率,给概率大
9、的赋“0”,概率小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”)。 霍夫曼编码构造出来的编码值不是唯一的。 对不同信号源的编码效率不同 由于编码长度可变,因此译码时间较长;编码长度的不统一,也使得硬件实现有难度。霍夫曼编码的特点行程编码 行程编码又称行程长度编码(Run Length Encoding,RLE),是一种熵编码。这种编码方法广泛地应用于各种图像格式的数据压缩处理中。 行程编码的原理是在给定的图像数据中寻找连续重复的数值,然后用两个字符取代这些连续值。即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。行程
10、编码 如图所示,假定一幅灰度图像,第n行的像素值为: 用RLE编码方法得到的代码为:4 41606083 3113130。代码斜黑体表示的数字是行程长度,黑体字后面的数字代表像素的颜色值。例如黑体字60代表有连续60个像素具有相同的颜色值,它的颜色值是8。行程编码分类行程编码分类 定长编码 定长编码是指编码的行程长度所用的二进制位数固定 不定长编码 变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。 8.2.4词典编码 词典编码(dictionary encoding)技术属于无损压缩技术,主要是利用数据本身包含许多重
11、复的字符串的特性。可以用一些简单的代号代替这些字符串,就可以实现压缩,实际上就是利用了信源符号之间的相关性。字符串与代号的对应表就是词典。词典编码法的种类有很多,归纳起来大致有两种。词典编码 第一种方法的思想是查找目前正在压缩的字符序列在以前输入的数据中是否出现过,然后用出现过的字符串代替重复的部分,它的输出仅仅是指向早期出现过的字符串“指针”。 这种编码的概念如右图所示。这里所指的词典是指用以前处理过的数据表示编码过程中遇到的重复部分。这类编码的所有算法都是以LZ77算法为基础的。 输入数据输入数据 A A B B C C D D X X 输出数据输出数据 A B C M M P . . .
12、 . . 词典编码 第二种算法的思想是从输入的数据中创建一个“短语词典”,这类短语不一定有具体的含义,可以是任意字符的组合。在编码过程中遇到在“短语词典”中出现的短语是,编码器就输出这个词典中的短语“索引号”,而不是短语本身。其概念如右图所示。 输输入入数数据据 输输出出数数据据 A 4 B 1 C C X X A D Y 编编码码词词典典 1. A B 2. A X 4. A X X 3. A E 5. B X D A A D Y . . 8.2.4.1 LZ77 LZ77算法算法 LZ77是以以色列计算机专家Abraham Lempel和Jakob Ziv在1977年开发和发表的。 此算法
13、的一个改进算法是由Storer和Szymanski在1982年开发的,称为LZSS算法。 LZ77 算法在某种意义上又可以称为“滑动窗口压缩”,该算法将一个虚拟的、可以跟随压缩进程滑动的窗口作为词典,要压缩的字符串如果在该窗口中出现,则输出其出现位置和长度。LZ77LZ77算法中涉及的概念算法中涉及的概念 1. 输入字符流(input stream):要被压缩的字符序列。 2. 字符(character):输入数据流中的基本单元。 3. 编码位置(coding position):输入数据流中当前要编码的字符位置,指前向缓冲存储器中的开始字符。 4. 前向缓冲存储器(Lookahead buf
14、fer):存放从编码位置到输入数据流结束的字符序列的存储器。 5. 窗口(window):指包含W个字符的窗口,字符是从编码位置开始向后数也就是最后处理的字符数。 6. 指针(pointer):指向窗口中的匹配串且含长度的指针。LZ77LZ77算法具体步骤算法具体步骤(1)把编码位置设置到输入数据流的开始位置。(2)找窗口中最长的匹配串(3)以“(Pointer, Length) Characters”的格式输出,其中Pointer是指向窗口中匹配串的指针,Length表示匹配字符的长度,Characters是前向缓冲存储器中的不匹配的第1个符。 (4)如果前向缓冲存储器不是空的,则把编码位置
展开阅读全文