04数据压缩基础课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《04数据压缩基础课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 04 数据压缩 基础 课件
- 资源描述:
-
1、数据压缩基础. . .数据压缩编码技术概述多媒体数据压缩的必要性和可行性衡量多媒体数据压缩技术的指标:压缩比算法简单,压缩解压缩速度快尽可能地恢复原始数据压缩方法分类无损压缩:Huffman编码、游程编码、算术编码、LZW编码有损压缩:预测编码、变换编码、模型编码、基于重要性的编码、混合编码新一代的数据压缩方法:矢量量化和子代编码、基于模型的压缩、分形压缩、小波变换压缩等等。. . .压缩的必要性音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。例如,一幅具有中等分辨率(640480)的真彩色图像(24b/像素),它的数据量约为7.37Mb/帧,一个700MB(By
2、te)的硬盘只能存放约100帧图像。若要达到每秒25帧的全动态显示要求,每秒所需的数据量为184Mb,而且要求系统的数据传输率必须达到184Mb/s。对于声音也是如此,若采用16b样值的PCM编码,采样速率选为44.1kHZ,则双声道立体声声音每秒将有176KB的数据量。. . .数据压缩的好处时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率. . .数据压缩技术实现的衡量标准 压缩比要大恢复后的失真小压缩算法要简单、速度快压缩能否用硬件实现. . .多媒体数据压缩技术分类平均信息量编码可逆压缩去冗余 统计特性源编码不可逆压缩有失真编码特征提取等
3、两种压缩技术不互斥,两种压缩技术的结合,可以达到最高可能的压缩率。. . .多媒体数据压缩技术分类无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不会使人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。. . .无损数据压缩主要介绍目前用得最多和技术最成熟的无损压缩编码技术,包括:霍夫曼编码算术编码游程编码RLE词典编码LZW. . .霍夫曼(Huffman)编码霍夫曼(Huffma
4、n)在1952年提出了另一种编码方法,即从下到上的编码方法。几个个问题值得注意:1.霍夫曼码没有错误保护功能;2.霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码;3.接收端需保存一个与发送端相同的霍夫曼码表。. . .字母频率编码A25%01B15%110C10%111D20%10E30%00霍夫曼(Huffman)编码. . .信源消减 信源符号集 B = b1 , b2 , b3 , b4 概率矢量 u = 0.1,0.38,0.22,0.3 步骤1:信源消减. . .步骤2:对信源符号赋值平均码长 L avg=1.946. . .霍夫曼码的特点 1,块码(组码
5、) 2,即时码 3,唯一可解码. . .霍夫曼码改型 亚最优 牺牲编码效率来换取编码速度截断霍夫曼码 前M个符号用霍夫曼编码 其余用前缀码+定长码(自然码)平移霍夫曼码 分组:相同符号数 用霍夫曼编码编第1组 其余组用平移符号+第一组霍夫曼码. . .霍夫曼码改型 . . .霍夫曼(Huffman)编码依赖于信源的统计特性,必须先统计得到信源的概率特性才能编码,这就限制了实际的应用。缺乏构造性,即它不能用某种数学方法建立起消息和码字之间的一一对应关系,而只能通过某种查表的方法建立起它们的对应关系。如果消息数目很多,那么所需存储的码表也很大,这将影响系统的存储量及编、译码速度。. . .练习初始
6、信源:a1:0.1,a2:0.4,a3::0.06,a4: 0.1,a5: 0.04,a6: 0.3. . .练习. . .算术编码 只需要用到加法和位移运算 从整个符号序列出发算术编码不再是块码,采用递推形式连续编码 . . .算术编码的特点: 1种从整个符号序列出发,采用递推形式连续编码的方法 不存在源符号和码字间的一一对应关系 1个算术码字要赋给整个信源符号序列,而每个码字本身确定了0和1之间的1个实数区间 算术编码过程只需用到加法和移位运算 . . .算术编码 b1=0.1b2=0.38b3=0.22b4=0.30.0000100120.0351562510码串: b1; b2; b3
7、; b4. . .算术编码在算术编码中需要注意的几个问题:1. 由于实际计算机精度不可能无限长,运算中溢出是明显的问题,但多数机器都有16位、32位或者64位的精度,因此可使用比例缩放法解决。2. 算术编码器对消息只产生一个码字,这个码字是在0, 1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。3. 算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。. . .算数编码练习初始信源:a1:0.1,a2:0.4,a3:0.5,码串:a1,a1,a2,a3. . .游程RLE编码RLE(run length encoding)编码的概念用RLE
8、编码方法得到的代码为:8 803 31505084 418 80。代码中用黑体表示的数字是行程长度,黑体字后面的数字代表象素的颜色值。例如黑体字50代表有连续50个象素具有相同的颜色值,它的颜色值是8。译码时按照与编码时采用的相同规则进行,还原后得到的数据与压缩前的数据完全相同。00000000 111 888 888 1111 00000000 8个0 3个1 50个8 4个1 8个0. . .词典编码词典编码的思想第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。. . .词典
9、编码词典编码的思想第二类算法的想法是企图从输入的数据中创建一个“短语词典(dictionary of thephrases)”,这种短语可以是任意字符的组合。编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。. . .词典编码J.Ziv和A.Lempel在1978年首次发表了介绍上述第二类编码方法的文章。在他们的研究基础上,Terry A.Welch在1984年发表了改进这种编码算法的文章,因此把这种编码方法称为LZW(Lempel-Ziv Walch)压缩编码,LZW算法在编码原理上,LZW与LZ78相比有如下差别:LZW只输出代表词
10、典中的缀-符串(String)的码字(code word)。这就意味在开始时词典不能是空的,它必须包含可能在字符流出现中的所有单个字符,即前缀根(Root)。由于所有可能出现的单个字符都事先包含在词典中,每个编码步骤开始时都使用一字符前缀(one-character prefix),因此在词典中搜索的第1个缀-符串有两个字符。LZW编码是围绕称为词典的转换表来完成的。. . .词典编码LZW算法LZW编码器使用了一种很实用的分析(parsing)算法,称为贪婪分析算法(greedy parsing algorithm)。在贪婪分析算法中,每一次分析都要串行地检查来自字符流(Charstream
11、)的字符串,从中分解出已经识别的最长的字符串,也就是已经在词典中出现的最长的前缀(Prefix)。用已知的前缀(Prefix)加上下一个输入字符C也就是当前字符(Current character)作为该前缀的扩展字符,形成新的扩展字符串缀-符串(String):Prefix.C。这个新的缀-符串(String)是否要加到词典中,还要看词典中是否存有和它相同的缀-符串String。如果有,那么这个缀-符串(String)就变成前缀(Prefix),继续输入新的字符,否则就把这个缀-符串(String)写到词典中生成一个新的前缀(Prefix),并给一个代码。. . .词典编码LZW算法LZW算
12、法得到普遍采用,它的速度比使用LZ77算法的速度快,因为它不需要执行那么多的缀-符串比较操作。对LZW算法进一步的改进是增加可变的码字长度,以及在词典中删除老的缀-符串。在GIF图像格式和UNIX的压缩程序中已经采用了这些改进措施之后的LZW算法。LZW算法取得了专利,专利权的所有者是美国的一个大型计算机公司Unisys(优利系统公司),除了商业软件生产公司之外,可以免费使用LZW算法。. . .词典编码压缩算法基于以下的中心思想1.为原始文本文件中的每个字母分配一个代码并存储到一个代码表中2.设置一个循环,每次从文件中获取一个字符。将使用一个缓冲字符串,把从文件中取出的字符连接在一起3.在每
13、次循环中,读取一个字符接到缓冲字符串的后面,形成一个新的临时字符串。如果该临时字符串以前曾经出现过就把它移到缓冲区里4.如果临时字符串不出现在代码表中,就为它分配一个代码,并把字符串和代码存储到代码表中,同时发送缓冲字符串所对应的代码重新设置缓冲字符串为刚刚读取的单个字符。. . .JPEG算法概要JPEG(Joint Photographic Experts Group) 是一个由 ISO和IEC两个组织机构联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准,因此又称为JPEG标准。JPEG是一个适用范围很广的静态图像
14、数据压缩标准,既可用于灰度图像又可用于彩色图像。使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。V-CD、DVD-Video。图像和视频的压缩技术. . .图像和视频的压缩技术JPEG压缩的三个阶段离散余弦变换(Discrete Cosine Transform, DCT)量化(Quantization)编码阶段(Encoding Phase). . .1. 离散余弦变换下面对正向离散余弦变换(FDCT)变换作几点说明。(1) 对每个单独的彩色图像分量,把整个分量图像分成88的图像块,并作为两维离散余
15、弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。. . .离散余弦变换阶段 707016) 12( cos 16) 12( cos),( )()(),(TxyjyixyxPjcicjiP(x, y)经DCT变换之后,T(0,0)是直流系数,其他为交流系数。在计算两维的DCT变换时,可把两维的DCT变换变成一维的DCT变换. . .图像和视频的压缩技术2.量化阶段量化是对经过FDCT变换后的频率系数进行量化。量化的目的是减小非“0”系数的幅度以及增加“0”值系数的数目。量化是图像质量下降的最主要原因Q=integer(T/U)其中:其中:DCTDCT变换系数变换系数T T ; U
16、 U是量化器步长,它是量化表的元素。是量化器步长,它是量化表的元素。. . .图像和视频的压缩技术量化器步长152 0 -48 0 -8 0 -7 01 3 5 7 9 11 13 15T=0 00 0 0 0 0 03 5 7 9 11 13 15 17-48 0 38 0 -3 0 2 05 7 9 11 13 15 17 19U=0 0 0 0 0 0 0 0-8 0 -3 0 13 0 -1 00 0 0 00 0 0 0-70 2 0 -1 0 7 00 0 0 00 0 0 07 9 11 13 15 17 19 219 11 13 15 17 19 21 2311 13 15 1
展开阅读全文