多媒体技术好资源第03讲多媒体数据压缩基础.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多媒体技术好资源第03讲多媒体数据压缩基础.pptx》由用户(刘殿科)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 资源 03 多媒体 数据压缩 基础
- 资源描述:
-
1、(1)数据压缩的必要性图像信号:黑白480360,8bit;大小是480 3601024=168.45KB彩色大小是480 36031024=506.25KB视频:PAL制每秒数据量506.25KB25帧/秒=12.36MB/s(2)数据压缩的可能性空间冗余时间冗余结构冗余视觉冗余知识冗余信息熵冗余(1 1)空间冗余)空间冗余静态图像静态图像中存在的最主要的一种数据冗中存在的最主要的一种数据冗余余在同一幅图像中,规则物体和规则背景在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性的表面物理特性具有相关性即对同一景物表面上采样点的颜色之间即对同一景物表面上采样点的颜色之间存在着空间连贯性
2、存在着空间连贯性例如:图像中一片连续的区域,其像素例如:图像中一片连续的区域,其像素为相同的颜色为相同的颜色空间冗余空间冗余(2 2)时间冗余)时间冗余序列图像序列图像(电视图像、动画电视图像、动画)和语音数据中所经常包含的和语音数据中所经常包含的冗余冗余一组连续的画面之间往往存在着时间和空间的相关性一组连续的画面之间往往存在着时间和空间的相关性例如:唱歌的歌手、两人谈话时背景一致等例如:唱歌的歌手、两人谈话时背景一致等(3 3)统计冗余)统计冗余 是空间冗余和时间冗余的总称。在数据处理是空间冗余和时间冗余的总称。在数据处理时,往往采用统计事件出现概率的办法来鉴别空时,往往采用统计事件出现概率
3、的办法来鉴别空间冗余和时间冗余,因此空间冗余和时间冗余具间冗余和时间冗余,因此空间冗余和时间冗余具有统计特性。有统计特性。(4 4)结构冗余)结构冗余在某些场景中,存在着明显的分布模式在某些场景中,存在着明显的分布模式结构结构结构可以通过特定的过程来生成结构可以通过特定的过程来生成例如:方格状的地板,蜂窝,砖墙等例如:方格状的地板,蜂窝,砖墙等(5 5)信息熵冗余)信息熵冗余信息熵:一组数据所携带的信息量。信息熵:一组数据所携带的信息量。冗余的产生是因为:在信源符号的表示冗余的产生是因为:在信源符号的表示过程中未遵循信息论下最优编码而造成。过程中未遵循信息论下最优编码而造成。通过熵编码进行压缩
4、通过熵编码进行压缩(6 6)视觉冗余)视觉冗余可以根据这些视觉特性来对图象信息进行取舍可以根据这些视觉特性来对图象信息进行取舍人类的视觉系统对图像场的敏感性:非均匀和非线性的人类的视觉系统对图像场的敏感性:非均匀和非线性的对亮度变化敏感,而对色度的变化对亮度变化敏感,而对色度的变化相对不敏感相对不敏感在高亮度区,人眼对亮度变化敏感在高亮度区,人眼对亮度变化敏感度下降度下降对物体边缘敏感,内部区域相对不对物体边缘敏感,内部区域相对不敏感敏感对整体结构敏感,而对内部细节相对整体结构敏感,而对内部细节相对不敏感对不敏感(7 7)知识冗余)知识冗余有许多图像的理解与某些有许多图像的理解与某些基础知识有
5、相当大的相关基础知识有相当大的相关性性这类规律性的结构可以由先验知这类规律性的结构可以由先验知识和背景知识得到识和背景知识得到例如:人脸的图像例如:人脸的图像知识冗余是模型编码的基础知识冗余是模型编码的基础多媒体数据压缩的性能指标多媒体数据压缩的性能指标多媒体数据压缩的性能指标多媒体数据压缩的性能指标(3)数据压缩编码分类 无损压缩无损压缩 指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同。无损压缩算法一般压缩比24。常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv&Welch)压缩算法。有损压缩有损压缩 指使用压缩后的数据进行
6、重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。压缩技术分类通用数据压缩(均为无损压缩)多媒体数据压缩(无损和有损压缩)基于统计模型的压缩技术基于字典模型的压缩技术Huffman编码算术编码LZ77LZ78LZW图像压缩音频和视频压缩MPEG等二值图像CCITTJBIG等灰度图像FELICSJPEG等彩色图像RLE编码JPEG等矢量图像PostScriptWMFCAD等压缩编码分类(按长
7、度)等长编码等长编码 ASCII编码编码 不等长编码不等长编码 编码长度是不等长的编码长度是不等长的 常见编码如常见编码如Huffman编码编码等长与不等长编码 例如:符号序列x=“aa bb cccc dddd eeeeeeee”采用ASCII编码:a=01100001 b=01100010 c=01100011 d=01100100 e=01100101 空=00100000等长编码:24*8=192bit如用后3位进行编码只需要3*24=72bit 压缩比为:压缩比为:72/192=等长与不等长编码 不等长编码方法 字符 次数 概率 码字 字长 E81/301 D41/61003 C41
8、/61013 空41/61103 a21/12 1110 4 B21/12 1111 4需要空间:1*8+3*4+3*4+3*4+2*4+2*4=60平均码长平均码长=总位数/字符出现次数=60/24=2.5不等长码唯一性问题 字符码1码2码3 A000 B101001 C11011011 D1110 01111对序列010110译码码1abc码2daca或ddb或abca码3bca(1)信息熵与信息量信息量信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从N个数中选定任一个数xj的概率为p(xj
9、),假定选定任意一个数的概率都相等,即p(xj)1/N,因此定义其信息量为:P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。)()(loglog/1log)(222jjjxpIxpNNxI(1)信息熵与信息量来源于40年代由Claude Shannon创立的信息论中的一条定理,这一定理借用了热力学中的名词“熵”(Entropy)来表示一条信息中真正需要编码的信息量。信源S发出的xj(j=1,2,n)共n个随机事件的自信息统计平均,即H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息量。其中:等概率事件的熵最大,
10、为:当P(x1)1时,P(x2)P(x3)P(xj)0,由(4-6)式得此时熵为由上可得熵的范围为:由上可得熵的范围为:njjjjxPxPxIESH12)(log)()()(NNNSHNj221log1log1)(0)(log)()(121xPxPSHNSH2log)(0平均码长与熵关系在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,则当LcH(S)有冗余,不是最佳。LcH(S)不可能。LcH(S)最佳编码(Lc稍大于H(S))。熵值为平均码长Lc的下限。平均码长Lc的计算公式为其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。njjjcxLxPL1)
11、()((j=1,2,n)熵的计算范例例:对信息aabbaccbaa,字符串长度为 10,字符a、b、c分别出现了5、3、2次,则 Ia=-log2(0.5)=1 Ib=-log2(0.3)=1.737 Ic=-log2(0.2)=2.322H(S)=0.5Ia+0.3Ib+0.2Ic=1.4855 如采用等长编码,则每个字符需要位;总的码长:L=5*+3*+2*=位对比一下,我们用ASCII编码表示该信息需要80位统计编码(熵)统计编码是根据消息出现概率的分布特性而进行的压缩编码 在消息和码字间找到明确的一一对应关系,以便恢复时能准确无误再现出来技术准备:编码通过模型,我们可以确定对某一个符号
12、该用多少位二进制数进行编码。现在的问题是,如何设计一种编码方案,使其尽量精确地用模型计算出来的位数表示某个符号。前缀编码规则:任何一个符号的编码都不是另一个符号编码的前缀。最简单的前缀编码字符字符编码编码A0B10C110D1110E111101110010101110110111100010 D A B B D C E A A B Shannon-Fano编码 采用从上到下的方法进行编码。仙农-范诺(Shannon-Fano)算法:首先按照符号出现的频度或概率排序,使用递归方法分成两个部分,每一部分具有近似相同的次数(概率)当概率和为1,进行编码Shannon-Fano编码例 有一幅40个象
13、素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需要120位。符 号ABCD E出现的次数157765H(S)=(15/40)*(40/15)+(7/40)*(40/7)+(5/40)*(40/5)=2.196这就是说每个符号用2.196位表示,40个象素需用87.84位Shannon-Fano编码例符号出现的次数()分配的代码需要的位数A15(0.375)1.41500030B7(0.175)2.5145
14、0114C7(0.175)2.51451014D6(0.150)2.736911018E5(0.125)3.000011115Shannon-Fano编码例例题:例题:cabcedeacacdeddaaabaababaaabbacdebaceada 例子中的信息编码为:例子中的信息编码为:10 00 01 10 111 110 111 00 10 00 10.码长共码长共91位,而使用位,而使用ASCII编码表示上述信息共需要编码表示上述信息共需要320位位a 16b 7c 6d 6e-5 a 16b 7-c 6-d 6e-5 a 00b 01c 10d 110e 111root0010111
15、abcde0依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长的码长,最后使得编码的平均码字最短。(2)编码过程编码过程 出现频率高的数据编码长度短,反出现频率高的数据编码长度短,反之亦然之亦然1 信号源的数据按照出现概率递减的顺序排列信号源的数据按照出现概率递减的顺序排列 2 合并两个最小出现概率,作为新数据出现概率合并两个最小出现概率,作为新数据出现概率 3 重复进行重复进行12,直至概率相加为,直至概率相加为1为止为止4 合并运算时,概率大者取合并运算时,概率大者取0,概率小者取,概率小者取15 记录概率为记录概率为1处到
展开阅读全文