数字媒体压缩技术课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字媒体压缩技术课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 媒体 压缩 技术 课件
- 资源描述:
-
1、第八章 数字媒体压缩技术 学习目标学习目标?1了解数字媒体数据压缩的原因。?2理解数字媒体数据压缩技术的不同分类。?3了解通用的数据压缩编码算法,如霍夫曼编码、词典编码、PCM、DM算法。?4.掌握常见数字媒体编码标准的含义和目标 第八章第八章 数字媒体压缩技术数字媒体压缩技术?8.1数据压缩及分类 8.1.1压缩的可能性与信息冗余 8.1.2数据压缩分类?8.2通用的数据压缩技术 8.2.1编码的理论基础 8.2.2霍夫曼编码 8.2.3行程编码 8.2.4词典编码 8.2.5脉冲编码调制 8.2.6增量调制(DM)8.2.7差分脉冲编码调制 第八章第八章 数字媒体压缩技术数字媒体压缩技术?
2、8.3数字媒体压缩标准 8.3.1声音压缩标准 8.3.2图像压缩标准 8.3.3运动图象压缩标准?8.3.3.1 MPEG标准?8.3.3.2 H.26X系列视频标准?8.3.3.3 AVS标准 8.1.1压缩的可能性与信息冗余?数据能够被压缩的主要原因在于媒体数据中存数据能够被压缩的主要原因在于媒体数据中存在数据的信息冗余在数据的信息冗余。信息量包含在数据之中,。信息量包含在数据之中,一般的数据冗余主要体现在:空间冗余 结构冗余 时间冗余 视觉冗余 知识冗余 信息熵冗余 数据压缩分类数据压缩分类 数据压缩分类 数据压缩方法分类 数字媒体压缩标准分类 统计编码 预测编码 变换编码 分析合成编
3、码 图像压缩 视音频压缩 JPEG 等 运动图像 MPEG H.26x系列 AVS 声音 MP 3 按信息压缩前后比较是否有损失进行划分?按信息压缩前后比较是否有损失,可以划分有损压缩和无损压缩。无损压缩指使用压缩后的数据进行重构,重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼(Huffman)算法和LZW算法。有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。按照媒体的类型进行压缩划分按照媒体的类型进行压缩划分?图像压缩标准?声音压缩标准?运动图象压缩标准 8.2通用的数据压缩技术?通用数据压缩技术:行程编码 字典编
4、码 熵编码等 PCM(脉冲调制编码)DM(增量调制编码)DPCM(自适应脉冲调制编码)?通用压缩方法具有压缩比低、通用性强等特点 8.2.1编码的理论基础?数据压缩技术的理论基础是信息论。?根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。?熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。信息与信息量信息与信息量?信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小,其信息量愈多,反之亦然。?若pi为第i个事件的概率为0 pi 1,则该事件的信息量为?一个信源包括的所有数据叫数据量,而数据量中包含有冗余信息
5、。信息量=数据量-冗余量 信息熵信息熵?信息熵是信源所有可能事件的平均信息量。?设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)1/N,则 I(xj)log2N-log2 1/N-log2p(xj)=Ip(xj)上式中,p(xj)是信源X发出xj的概率,I(xj)的含义是信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。?香农把它称为“信息熵”(Entropy),用符号 H 表示,单位是比特。信息熵(续)?信源X发出的 n个随机事件 xj(j=1,2,n)的平均信息量为 H(X)=EI(xj)=?由上可得熵的范围为:0 H(X)?njjj
6、xPxP12)(log)(N2log信息熵(续)?在编码中用熵值来衡量是否为最佳编码。若以 Lc表示编码器输出码字的平均码长,其计算公式为:Lc (j=1,2,n)?其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。即平均码长=概率*码长?njjjxLxP1)()(8.2.2霍夫曼编码?霍夫曼编码(Huffman)是运用信息熵原理的一种无损编码方法,这种编码方法根据源数据各信号发生的概率进行编码。?在源数据中出现概率大的信号,分配的码字越短;出现概率越小的信号,其码字越长,从而达到用尽可能少的码表示源数据。霍夫曼编码的算法 1.初始化,根据符号概率的大小顺序对符号进行排序。2.
7、把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。3.重复第2步,直到形成一个符号为止(树),其概率和等于1。4.分配码字。码字分配从最后一步开始反向进行,即从最后两个概率开始逐渐向前进行编码,对于每次相加的两个概率,给概率大的赋“0”,概率小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”)。行程编码?行程编码又称行程长度编码(Run Length Encoding,RLE),是一种熵编码。这种编码方法广泛地应用于各种图像格式的数据压缩处理中。?行程编码的原理是在给定的图像数据中寻找连续重复的数值,然后用两个字符取代这些连续
8、值。即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。行程编码?如图,假定一幅灰度图像,第如图,假定一幅灰度图像,第 n n行的像素值为:行的像素值为:?用用RLE编码方法得到的代码为:编码方法得到的代码为:4160831130。代码斜黑体表示的数字是行程长度,黑体字后面码斜黑体表示的数字是行程长度,黑体字后面的数字代表像素的颜色值。例如黑体字的数字代表像素的颜色值。例如黑体字 6060代表代表有连续60个像素具有相同的颜色值,它的颜色个像素具有相同的颜色值,它的颜色值是8 8。1111 888 888 1111 00000000000000 4 个 1
9、60 个 8 3个 1 13个 0 行程编码分类行程编码分类?定长编码 定长编码是指编码的行程长度所用的二进制位数固定?不定长编码 变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。8.2.4词典编码?词典编码(dictionary encoding)技术属于无损压缩技术,根据数据本身包含有重复代码序根据数据本身包含有重复代码序列这个特性,用一些简单代号代替这些字符串,就可以实现压缩。字符串与代号对应表就是词。字符串与代号对应表就是词典。?例如文本文件(码词表示字符)和光栅图像(码词表示像素)就具有这种特性。(码词表示
10、像素)就具有这种特性。?词典编码法的种类很多,归纳起来大致有两种。词典编码?第一种方法的思想是查找目前正在压缩的字符序列在以前输入的数据中是否出现过,然后用出现过的字符串代替重复的部分,它的输出仅仅是指向早期出现过的字符串“指针”。?这种编码的概念如右图所示。这里所指的词典是用以前处理过的数据表示编码过程中遇到的重复部分。这类编码的所有算法都是以LZ77算法为基础的。输入数据 A A B B C C D D X X 输出数据 A B C M M P.词典编码?第二种算法的思想是从输入的数据中创建一个“短语词典”,这类短语不一定有具体的含义,可以是任意字符的组合。在编码过程中遇到在“短语词典”中
11、出现的短语,编码器就输出这个词典中的短语“索引号”,而不是短语本身。其概念如右图所示。输入数据 输出数据 A 4 B 1 C C X X A D Y 编码词典 1.A B 2.A X 4.A X X 3.A E 5.B X D A A D Y.8.2.4.1 LZ77算法?LZ77是以以色列计算机专家 Abraham Lempel和Jakob Ziv在1977年开发和发表的。?此算法的一个改进算法是由 Storer和Szymanski在1982年开发的,称为LZSS算法。?LZ77算法在某种意义上又可以称为“滑动窗口压缩”,该算法将一个虚拟的、可以跟随压缩进程滑动的窗口作为词典,要压缩的字符串
12、如果在该窗口中出现,则输出其出现位置和长度。LZ77LZ77算法中涉及的概念算法中涉及的概念 1.输入字符流(input stream):要被压缩的字符序列。2.字符(character):输入数据流中的基本单元。3.编码位置(coding position):输入数据流中当前要编码的字符位置,指前向缓冲存储器中的开始字符。4.前向缓冲存储器(Lookahead buffer):存放从编码位置到输入数据流结束的字符序列的存储器。5.窗口(window):指包含W个字符的窗口,字符是从编码位置开始向后数也就是最后处理的字符数。6.指针(pointer):指向窗口中的匹配串且含长度的指针。LZ77
13、LZ77算法具体步骤算法具体步骤 LZ77编码算法的核心是查找从前向缓冲器开始的最长的匹配串。算法的具体执行步骤如下:(1)把编码位置设置到输入数据流的开始位置。(2)找窗口中最长的匹配串(3)以“(Pointer,Length)Characters”的格式输出,其中Pointer是指向窗口中匹配串的指针,Length表示匹配字符的长度,Characters是前向缓冲存储器中的不匹配的第1个符。(4)如果前向缓冲存储器不是空的,则把编码位置和窗口向前移(Length+1)个字符,然后返回到步骤(2)。“输出”栏以(Back_chars,Chars_length)Explicit_charact
14、er格式输出。其中(Back_chars,Chars_length)是指指向匹配串的指针,告诉译码器“在这个窗口中向后退Back_chars个字符然后拷贝Chars_length个字符到输出”,Explicit_character是真实字符。例如,表中的输出“(5,2)C”告诉译码器回退5个字符,然后拷贝2个字符“AB”8.2.4.2 LZW算法?LZWLZW压缩算法是一种新颖的压压缩算法是一种新颖的压缩方法,它采用了一种先进的串表压缩,将每个第一次出现的串放在一个串表中,用一个数字来表示串,压缩文件只存贮数字,则不存贮串,从而使图像文件的压缩效率得到较大的提高。?LZWLZW编码是围绕称为词
展开阅读全文