数字媒体压缩技术课件.ppt

上传人（卖家）：晟晟文业

文档编号：4487734

上传时间：2022-12-14

格式：PPT

页数：57

大小：10.41MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《数字媒体压缩技术课件.ppt》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数字媒体压缩技术课件

资源描述：: 1、第八章数字媒体压缩技术学习目标学习目标?1了解数字媒体数据压缩的原因。?2理解数字媒体数据压缩技术的不同分类。?3了解通用的数据压缩编码算法，如霍夫曼编码、词典编码、PCM、DM算法。?4.掌握常见数字媒体编码标准的含义和目标第八章第八章数字媒体压缩技术数字媒体压缩技术?8.1数据压缩及分类 8.1.1压缩的可能性与信息冗余 8.1.2数据压缩分类?8.2通用的数据压缩技术 8.2.1编码的理论基础 8.2.2霍夫曼编码 8.2.3行程编码 8.2.4词典编码 8.2.5脉冲编码调制 8.2.6增量调制（DM）8.2.7差分脉冲编码调制第八章第八章数字媒体压缩技术数字媒体压缩技术?
2、8.3数字媒体压缩标准 8.3.1声音压缩标准 8.3.2图像压缩标准 8.3.3运动图象压缩标准?8.3.3.1 MPEG标准?8.3.3.2 H.26X系列视频标准?8.3.3.3 AVS标准 8.1.1压缩的可能性与信息冗余?数据能够被压缩的主要原因在于媒体数据中存数据能够被压缩的主要原因在于媒体数据中存在数据的信息冗余在数据的信息冗余。信息量包含在数据之中，。信息量包含在数据之中，一般的数据冗余主要体现在：空间冗余结构冗余时间冗余视觉冗余知识冗余信息熵冗余数据压缩分类数据压缩分类数据压缩分类数据压缩方法分类数字媒体压缩标准分类统计编码预测编码变换编码分析合成编
3、码图像压缩视音频压缩 JPEG 等运动图像 MPEG H.26x系列 AVS 声音 MP 3 按信息压缩前后比较是否有损失进行划分?按信息压缩前后比较是否有损失，可以划分有损压缩和无损压缩。无损压缩指使用压缩后的数据进行重构，重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼(Huffman)算法和LZW算法。有损压缩是指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。按照媒体的类型进行压缩划分按照媒体的类型进行压缩划分?图像压缩标准?声音压缩标准?运动图象压缩标准 8.2通用的数据压缩技术?通用数据压缩技术：行程编码字典编
4、码熵编码等 PCM（脉冲调制编码）DM（增量调制编码）DPCM（自适应脉冲调制编码）?通用压缩方法具有压缩比低、通用性强等特点 8.2.1编码的理论基础?数据压缩技术的理论基础是信息论。?根据信息论的原理，可以找到最佳数据压缩编码方法，数据压缩的理论极限是信息熵。?熵是信息量的度量方法，它表示某一事件出现的消息越多，事件发生的可能性就越小，数学上就是概率越小。信息与信息量信息与信息量?信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小，其信息量愈多，反之亦然。?若pi为第i个事件的概率为0 pi 1，则该事件的信息量为?一个信源包括的所有数据叫数据量，而数据量中包含有冗余信息
5、。信息量=数据量-冗余量信息熵信息熵?信息熵是信源所有可能事件的平均信息量。?设从N个数中选定任一个数xj的概率为p(xj)，假定选定任意一个数的概率都相等，即p(xj)1/N，则 I(xj)log2N-log2 1/N-log2p(xj)=Ip(xj)上式中，p(xj)是信源X发出xj的概率,I(xj)的含义是信源X发出xj这个消息（随机事件）后，接收端收到信息量的量度。?香农把它称为“信息熵”(Entropy)，用符号 H 表示，单位是比特。信息熵(续)?信源X发出的 n个随机事件 xj(j=1,2,n)的平均信息量为 H(X)=EI(xj)=?由上可得熵的范围为：0 H(X)?njjj
6、xPxP12)(log)(N2log信息熵(续)?在编码中用熵值来衡量是否为最佳编码。若以 Lc表示编码器输出码字的平均码长，其计算公式为：Lc （j=1,2,n）?其中：P(xj)是信源X发出xj的概率，L(xj)为xj的编码长。即平均码长=概率*码长?njjjxLxP1)()(8.2.2霍夫曼编码?霍夫曼编码（Huffman）是运用信息熵原理的一种无损编码方法，这种编码方法根据源数据各信号发生的概率进行编码。?在源数据中出现概率大的信号，分配的码字越短；出现概率越小的信号，其码字越长，从而达到用尽可能少的码表示源数据。霍夫曼编码的算法 1.初始化，根据符号概率的大小顺序对符号进行排序。2.
7、把概率最小的两个符号组成一个新符号（节点），即新符号的概率等于这两个符号概率之和。3.重复第2步，直到形成一个符号为止（树），其概率和等于1。4.分配码字。码字分配从最后一步开始反向进行，即从最后两个概率开始逐渐向前进行编码，对于每次相加的两个概率，给概率大的赋“0”，概率小的赋“1”（也可以全部相反，如果两个概率相等，则从中任选一个赋“0”，另一个赋“1”）。行程编码?行程编码又称行程长度编码（Run Length Encoding，RLE），是一种熵编码。这种编码方法广泛地应用于各种图像格式的数据压缩处理中。?行程编码的原理是在给定的图像数据中寻找连续重复的数值，然后用两个字符取代这些连续
8、值。即将具有相同值的连续串用其串长和一个代表值来代替，该连续串就称为行程，串长称为行程长度。行程编码?如图，假定一幅灰度图像，第如图，假定一幅灰度图像，第 n n行的像素值为：行的像素值为：?用用RLE编码方法得到的代码为：编码方法得到的代码为：4160831130。代码斜黑体表示的数字是行程长度，黑体字后面码斜黑体表示的数字是行程长度，黑体字后面的数字代表像素的颜色值。例如黑体字的数字代表像素的颜色值。例如黑体字 6060代表代表有连续60个像素具有相同的颜色值，它的颜色个像素具有相同的颜色值，它的颜色值是8 8。1111 888 888 1111 00000000000000 4 个 1
9、60 个 8 3个 1 13个 0 行程编码分类行程编码分类?定长编码定长编码是指编码的行程长度所用的二进制位数固定?不定长编码变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。8.2.4词典编码?词典编码（dictionary encoding）技术属于无损压缩技术，根据数据本身包含有重复代码序根据数据本身包含有重复代码序列这个特性，用一些简单代号代替这些字符串，就可以实现压缩。字符串与代号对应表就是词。字符串与代号对应表就是词典。?例如文本文件（码词表示字符）和光栅图像（码词表示像素）就具有这种特性。（码词表示
10、像素）就具有这种特性。?词典编码法的种类很多，归纳起来大致有两种。词典编码?第一种方法的思想是查找目前正在压缩的字符序列在以前输入的数据中是否出现过，然后用出现过的字符串代替重复的部分，它的输出仅仅是指向早期出现过的字符串“指针”。?这种编码的概念如右图所示。这里所指的词典是用以前处理过的数据表示编码过程中遇到的重复部分。这类编码的所有算法都是以LZ77算法为基础的。输入数据 A A B B C C D D X X 输出数据 A B C M M P.词典编码?第二种算法的思想是从输入的数据中创建一个“短语词典”，这类短语不一定有具体的含义，可以是任意字符的组合。在编码过程中遇到在“短语词典”中
11、出现的短语，编码器就输出这个词典中的短语“索引号”，而不是短语本身。其概念如右图所示。输入数据输出数据 A 4 B 1 C C X X A D Y 编码词典 1.A B 2.A X 4.A X X 3.A E 5.B X D A A D Y.8.2.4.1 LZ77算法?LZ77是以以色列计算机专家 Abraham Lempel和Jakob Ziv在1977年开发和发表的。?此算法的一个改进算法是由 Storer和Szymanski在1982年开发的，称为LZSS算法。?LZ77算法在某种意义上又可以称为“滑动窗口压缩”，该算法将一个虚拟的、可以跟随压缩进程滑动的窗口作为词典，要压缩的字符串
12、如果在该窗口中出现，则输出其出现位置和长度。LZ77LZ77算法中涉及的概念算法中涉及的概念 1.输入字符流(input stream)：要被压缩的字符序列。2.字符(character)：输入数据流中的基本单元。3.编码位置(coding position)：输入数据流中当前要编码的字符位置，指前向缓冲存储器中的开始字符。4.前向缓冲存储器(Lookahead buffer)：存放从编码位置到输入数据流结束的字符序列的存储器。5.窗口(window)：指包含W个字符的窗口，字符是从编码位置开始向后数也就是最后处理的字符数。6.指针(pointer)：指向窗口中的匹配串且含长度的指针。LZ77
13、LZ77算法具体步骤算法具体步骤 LZ77编码算法的核心是查找从前向缓冲器开始的最长的匹配串。算法的具体执行步骤如下：（1）把编码位置设置到输入数据流的开始位置。（2）找窗口中最长的匹配串（3）以“(Pointer,Length)Characters”的格式输出，其中Pointer是指向窗口中匹配串的指针，Length表示匹配字符的长度，Characters是前向缓冲存储器中的不匹配的第1个符。（4）如果前向缓冲存储器不是空的，则把编码位置和窗口向前移(Length+1)个字符，然后返回到步骤（2）。“输出”栏以(Back_chars，Chars_length)Explicit_charact
14、er格式输出。其中(Back_chars，Chars_length)是指指向匹配串的指针，告诉译码器“在这个窗口中向后退Back_chars个字符然后拷贝Chars_length个字符到输出”，Explicit_character是真实字符。例如，表中的输出“(5，2)C”告诉译码器回退5个字符，然后拷贝2个字符“AB”8.2.4.2 LZW算法?LZWLZW压缩算法是一种新颖的压压缩算法是一种新颖的压缩方法，它采用了一种先进的串表压缩，将每个第一次出现的串放在一个串表中，用一个数字来表示串，压缩文件只存贮数字，则不存贮串，从而使图像文件的压缩效率得到较大的提高。?LZWLZW编码是围绕称为词
15、典的转编码是围绕称为词典的转换表来完成的。换表来完成的。不作要求！8.2.5脉冲编码调制?脉冲编码调制脉冲编码调制(Pulse Code Modulation,PCM)(Pulse Code Modulation,PCM)就是将模拟调制信号的采样值变换为脉冲码组。就是将模拟调制信号的采样值变换为脉冲码组。?PCMPCM编码包括如下三个过程：编码包括如下三个过程：采样，将模拟信号转换为时间离散的样本脉冲序列。量化，将离散时间连续幅度的抽样信号转换成为离散时间离散幅度的数字信号。时间离散幅度的数字信号。编码，用一定位数的脉冲码组表示量化采样值。PCMPCM系统原理图系统原理图模拟信号滤波采样
16、量化编码数字化（A/D）传输模拟信号 D/A 转换逆量化解码模拟化（D/A）PCM编码的优点?有很强的抗干扰性?能方便的利用计算机编程，实现各种智能化设计。8.2.6增量调制（DM）?增量调制增量调制也称调制调制(delta modulation(delta modulation，DM)DM)，它是一种预测编码技术，是它是一种预测编码技术，是 PCMPCM编码的一种变形。编码的一种变形。?DM是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0 0”和“1 1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反
17、则用“0 0”表示，或者相反。DM波形编码的原理波形编码的原理?在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化，这种现象就称为增量调制器的“斜率过载”。?在输入信号缓慢变化部分，即输入信号与预测信号的差值接近零的在输入信号缓慢变化部分，即输入信号与预测信号的差值接近零的区域，增量调制器的输出出现随机交变的“0”和“1”。这种现象称为增量调制器的粒状噪声 8.2.7差分脉冲编码调制?差分脉冲编码调制（差分脉冲编码调制（Differential Pulse Code Modulation，DPCM）是利用样本与样本之间存）是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。
18、术。?差值脉冲编码调制是利用信号的相关性找出可差值脉冲编码调制是利用信号的相关性找出可以反映信号变化特征的一个差值量进行编码。DPCM的基本工作原理?根据过去的样本去估算（estimate）下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。?DPCM与脉冲编码调制（PCM）不同处在于，PCM是直接对采样信号进行量化编码，而 DPCM是对实际信号值与预测值之差进行量化编码。DPCM的原理图的原理图量化器 S(k)+逆量化器预测器 d(k)I(k)Se(k-1)8比特PCM 样本k PCM 样本k-1 Se(k-1)dq(
19、k)Sr(k)+-8.3 数字媒体压缩标准?8.3.1 声音压缩标准?MP3是MPEG-1（码率1.5Mb/s）的标准草案中音频编码的Layer3。?MP3 最大特点是能以较小的比特率、较大压缩比达到近乎完美的 CD音质，制作简单，交流方便。?MP3压缩编码是一个国际性全开放的编码方案,其编码算法流程大致分为时频映射、心理声学模型、量化编码三大功能模块，这三个功能模块是实现MP3 编码的关键。MP3编码框图?下图为下图为MP3编码框图 PCM 输入子带滤波器组霍夫曼编码心理声学模型 FFT MDCT 比特和比例因子分配与编码比特流组装信号掩蔽比已编码数据流边信息 MP4 MP4
20、?MP4采用MPEG-2 AAC(Advanced Audio Coding)技术。?MP4的特点是音质更加完美而压缩比更大。它增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等 MP3没有的特性，使得在音频压缩后仍能完美的再现 CD的音质。8.3.2图像压缩标准?JPEG是国际标准组织是国际标准组织(ISO)和国际电工委员会和国际电工委员会（IEC）制定出的第一套国际）制定出的第一套国际静态图像压缩标准静态图像压缩标准：ISO/IEC 10918 1号标准“多灰度连续色调静态图像压缩编码态图像压缩编码”俗称为俗称为 JPEG，以其优异的性，以其优异的性能，该标准一直到当前仍
21、被因特网、数码相机等很多领域广泛应用。?JPEG包含两种基本的压缩算法：无损压缩算法包含两种基本的压缩算法：无损压缩算法（基于差分脉冲调制）和有损压缩算法（基于离散余弦变换）。JPEG算法框图算法框图 JPEG算法压缩编码步骤（1）使用正向离散余弦变换（Forward Discrete Cosine Transform，FDCT）把信息从空间域变换成频率域的数据，并利用数据的频率特性进行处理；（2）使用加权函数对 DCT系数进行量化，这个加权函数对于人的视觉系统是最佳的；（3）使用霍夫曼可变字长熵编码器对量化系数进行编码。JPEG压缩编码算法的主要计算步骤压缩编码算法的主要计算步骤（1）正向离
22、散余弦变换(FDCT)。（2）量化(quantization)。（3）Z字形编码(zigzag scan)。（4）使用差分脉冲编码调制（differential pulse code modulation，DPCM）对直流系数（DC）进行编码。（5）使用行程长度编码（Run Length Encoding，RLE）对交流系数(AC)进行编码。（6）熵编码(entropy coding)。JPEG2000 JPEG2000?JPEG2000JPEG2000弥补了传统弥补了传统JPEGJPEG压缩技术缺陷，有以压缩技术缺陷，有以下优点下优点高压缩率高压缩率支持无损压缩和有损压缩渐进传输对感
23、兴趣区域压缩对感兴趣区域压缩 8.3.3.1 MPEG标准?运动图像专家组运动图像专家组MPEGMPEG是由国际标准化组织是由国际标准化组织 ISO和和国际电工委员会国际电工委员会IEC联合成立的，负责开发电视联合成立的，负责开发电视图像数据和声音数据的编码、解码和它们的同图像数据和声音数据的编码、解码和它们的同步标准。这个专家组开发的标准称为步标准。这个专家组开发的标准称为 MPEG标准。标准。MPEG-1标准?MPEG-1是“信息技术用于数据速率高达大约1.5 Mbit/s的数字存储媒体的活动图像和伴音编码（Information technology-Coding of moving p
24、ictures and associated audio for digital storage media at up to about 1.5 Mbit/s）”，1992年成为正式标准，1993年公布。?该标准包括五个部分，分别为：系统、电视图像、音频、一致性测试和软件模拟。?MPEG-1的数据流包含：图像流、伴音流和系统流三种成分。MPEG-1译码器方框图译码器方框图?下图为MPEG-1译码器方框图。图像流包含画面信息，伴音流包含声音信息，系统流实现图像和伴音的同步，所有播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。MPEG-2标准?MPEG-2标准包括了系统、电视图像、音频
25、、一标准包括了系统、电视图像、音频、一致性测试、软件模拟、数字存储媒体命令和控致性测试、软件模拟、数字存储媒体命令和控制扩展协议、先进声音编码、编码器实时接口扩展标准、扩展标准、DSM-CC一致性扩展测试等。一致性扩展测试等。?MPEG-2的主要特点是：的主要特点是：1）MPEG-2解码器兼容MPEG-1和MPEG-2标准。2）其视频数据速率为3 Mb/s15Mb/s，基本分辨率为720576像素，每秒可播放30帧画面。3）可以301或更低的压缩比提供具有广播级质量的视频图像。4）允许在画面质量、存储容量和带宽之间选择，在一定范围内改变压缩比。MPEG-2的系统模型的系统模型 MPEG-4标准
26、?MPEG-4标准于1998年11月公布，是各种音频/视频对象的编码，包括了系统、电视图像、音频、一致性测试和参考软件、传输多媒体集成框架等。?MPEG-4为多媒体数据压缩编码提供的是一种格式、一种框架，而不是具体算法，以建立一种更自由的通信与开发环境。?MPEG-4的目标是支持多种多媒体的应用，特别是多媒体信息基于内容的检索和访问，可以根据不同的应用需求现场配置解码器。其编码系统也是开放的，可以随时加入新的有效的算法模块。MPEG-4系统示意图系统示意图 MPEG-7标准?MPEG-7标准于2001年公布，称为多媒体内容描述接口，述接口，包括系统、描述定义语言、电视图像、音频、多媒体描述框
27、架、参考软件以及一致性测试七个部分。?MPEG-7标准的目的是产生一个描述多媒体内容的标准，支持对多媒体信息在不同程度层面上的解释和理解，从而使其可以根据用户的需要进行传递和存取。?MPEG-7注重的是提供视听信息内容的描述方案注重的是提供视听信息内容的描述方案，并不包括针对不同应用的特征提取方法和搜索引擎。MPEG-21标准?MPEG-21基于两个基本概念：分布和处理基本单元（Digital Item，DI）以及DI与用户间的互操作。?MPEG-21可表述为以一种高效、透明和可以互操作的方式支持用户交换、接入、使用甚至操作DI的技术。DI是MPEG-21 框架中一个具有标准表示、身份认证和相
28、关元数据的数字对象。这个实体是框架中分布和处理的基本单元。用户是指与 MPEG-21 进行环境交互或者使用DI的任何实体。?MPEG-21MPEG-21可以被看成是提供用户间交互的一个框架。H.26X系列视频标准?H.26X系列视频标准是国际电信联盟ITU的视频编码专家组（ITU-T）制定的系列图像压缩标准，主要有H.261、H.263、H264等。这些视频标准主要应用于实时视频通信领域，如会议电视、可视电话等。H.26X系列视频标准（续）?H.261H.261又称Px64，传输码率为P P*64kbps64kbps，其中P P可变。根据图像传输清晰度的不同，传输码率变化范围在64kbps至1
29、.92Mbps之间，编码方法包括DCT变换，可控步长线性量化，变长编码及预测编码等。?H.263H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准，其标准输入图像格式可以是S-QCIFS-QCIF、QCIF、CIF、4CIF或者16CIF的彩色420子取样图像。?H.264H.264引入了很多先进的技术，可得到较高的压缩比，但提高了算法的复杂度。因此H.264标准中加入了去块效应滤波器，对块的边界进行滤波。8.3.3.3 AVS标准?AVSAVS（Audio Video StandardsAudio Video Standards）是中国自主制定的音视频编码技术标准，其核心是把数字视频和音频数据压缩为原来的几十分之一甚至百分之一以下。?AVSAVS标准包括系统、视频、音频、数字版权保护等四个主要技术标准和一致性测试等支撑标准。?AVS-视频当中具有特征性的核心技术包括：8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。AVS标准和相关国际标准的发展路线图标准和相关国际标准的发展路线图本章作业本章作业?P223?计算与简答题?1,2,3,4,5,6 1,2,3,4,5,6

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：数字媒体压缩技术课件.ppt
链接地址：https://www.163wenku.com/p-4487734.html

晟晟文业

内容提供者

实名认证

联系作者