第6章-音频压缩编码技术及其国际标准-2课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第6章-音频压缩编码技术及其国际标准-2课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 压缩 编码 技术 及其 国际标准 课件
- 资源描述:
-
1、1第六章 音频压缩编码技术及其国际标准26.1 6.1 概述概述6.2 MPEG6.2 MPEG音频压缩编码音频压缩编码6.3 Dolby AC-36.3 Dolby AC-3数字音频压缩编码技术数字音频压缩编码技术36.2.1 MPEG-1音频压缩编码标准6.2.2 MPEG-2音频压缩编码标准6.2.3 MPEG-2 ACC音频压缩编码标准6.2.4 MPEG-4音频压缩编码标准6.2 MPEG音频压缩编码音频压缩编码4 MPEG-1(ISOMPEG-1(ISOIEC11172)IEC11172)标准的第三部分标准的第三部分(ISO(ISOIEC 11172-3)IEC 11172-3),
2、称为,称为MPEG-1 MPEG-1 音频。它音频。它是世界上第是世界上第一个高保真声音数据压缩标准,得到极其广泛的一个高保真声音数据压缩标准,得到极其广泛的应用应用 编码器的输入信号为线性PCM信号采样率为32,44.1或48 kHz,16位编码器的输出信号为32384 kbpsMPEG编码器32,44.1,48 kHzPCM32 kbps384 kbps6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准5MPEG-1MPEG-1音频的三个层次音频的三个层次按照压缩编码的复杂程度规定了三个层次。层次越高,压缩比越大,编解码器越复杂。每个层次针对不同的应用。层层算法算法压缩比压缩比码率码
3、率最小延迟最小延迟 通常延迟通常延迟第一层MUSICAM4:13841950第二层MUSICAM68:1256-19235100第三层ASPEC1012:1128-112591506.2.1 MPEG-1音频压缩编码标准音频压缩编码标准6 Layer ILayer I是简单型,通常目标码率每通道是简单型,通常目标码率每通道192kbit192kbits s,立体声码率为,立体声码率为384kbit384kbits s,压,压缩比为缩比为1:41:4。Layer ILayer I被广泛应用在被广泛应用在VCDVCD的音频的音频压缩编码中。压缩编码中。Layer Layer 以以Layer ILa
4、yer I为基础,但压缩编码为基础,但压缩编码的复杂度增加了。的复杂度增加了。通常目标码率为每通道通常目标码率为每通道128kbit128kbits s,立体声码率为,立体声码率为256kbit256kbits s,压,压缩比为缩比为1:61:6。广泛应用于数字音频广播和数字。广泛应用于数字音频广播和数字电视演播室等专业的数字音频制作、存储和传电视演播室等专业的数字音频制作、存储和传送中。送中。6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准7 Layer IIILayer III采用混合压缩技术,复杂度采用混合压缩技术,复杂度最高。最高。Layer IIILayer III通过使用非
5、均匀量化,自通过使用非均匀量化,自适应分割和量化后的熵编码来提高编码效率。适应分割和量化后的熵编码来提高编码效率。目标码率为每通道目标码率为每通道64kbit64kbits s,立体声为,立体声为128kbit128kbits s,压缩比为,压缩比为1:121:12。Layer IIILayer III在在低码率下有高品质的音质,主要应用于需要低码率下有高品质的音质,主要应用于需要较低码率的领域。较低码率的领域。三三个层的解码器后向兼容个层的解码器后向兼容,即,即Layer Layer IIIIII的解码器可以对三个层的码流解码,的解码器可以对三个层的码流解码,Layer Layer 解码器可
6、以解码解码器可以解码Layer ILayer I及及Layer Layer。6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准8图图6.3 Layer I 6.3 Layer I 音频编码器框图音频编码器框图3232子带子带滤波器组滤波器组量化编码量化编码比例因子比例因子计算计算512512点点FFTFFT心理声学心理声学模型模型动态动态比特分配比特分配复复用用器器PCMPCM输入信号输入信号32323232比例因子比例因子比特比特分配分配音频音频码流码流6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准9MPEG-1MPEG-1 Audio 的滤波器组的滤波器组输入的音频信号首先
7、通过一个多通道滤波器组,变换成等宽的32个子带,这些滤波器组的输出是临界频带系数样值。由于临界频带不是等宽的,所以低频端的子带可能覆盖了多个临界频带。MPEG AUDIO MPEG AUDIO 滤波器组频带滤波器组频带频率增加频率增加临界频带临界频带6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准10MPEG-1PEG-1 Audio 的滤波器组输出的滤波器组输出第一层每帧包含384个时域样本,每个子带输出12个频域样本。每32个时域样本每子带输出1个频域样本。第二层和第三层每帧为1152个时域样本,每个子带输出36个频域样本6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准11
8、n比例因子比例因子按信号的大小来改变量化步长,信号大时用较大的量化步长,信号小时用较小的量化步长。因此,将码字分为两组,一组用来表示量化步长,又称为比例因子,其余的比特用来均匀量化信号,代表信号幅值的尾数根据每个子带12个样值中的最大的样值,确定比例因子6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准12心理声学模型的实现心理声学模型的实现用512点FFT把时域信号变换到频域将得到的频域样本按临界频带分组计算由临界频带引起的每个子带的掩蔽阈值,组合每个子带的单个掩蔽阈值,形成全局掩蔽阈值计算每个子带的信掩比SMR,使用每个子带中的最大信号与全局掩蔽阈值计算信掩比,计算方法同信噪比SNR
9、,单位也是dB将每个子带的信掩比输出给动态比特分配模块6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准13动态比特分配动态比特分配全局掩蔽阈值决定了每个子带所容许的最大量化噪声,对于那些信掩比小于1的子带,完全不用编码,直接丢弃就可以了对于信掩比大于等于1的子带,如果将尾数都量化为相同的比特数,那么不同子带的掩蔽阈值和量化噪声的比(掩蔽噪声比)往往是不同的,为了使声音质量最佳,应当使各个子带的掩蔽噪声比相等。mpeg-1采用了一种逐步逼近的方式,如教材所述,但该方法不是唯一的,编码器厂家可以自己研究更好的方法实现掩蔽噪声比的均匀化6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准
10、14量化量化根据动态比特分配的结果,对需要编码的子带的样本进行量化l复用器复用器把比特分配信息、比例因子和每个子带的量化以后的样本尾数组织起来,配以同步头和CRC校验位及若干附加数据,就形成Layer I的帧同步头同步头(32bit)(32bit)CRCCRC(16bit)(16bit)位分配位分配(4bit)(4bit)比例因子比例因子(6bit)(6bit)子带子带样本样本子带子带样本样本附加数据附加数据(未指定未指定)6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准15Layer IILayer IILayer II以Layer I为基础,编码原理一样,但是有一些改进子带不再是均
11、匀宽度,而是按照临界频带划分子带,这样更符合人的听觉特性,同时滤波器组变得更复杂使用1024点FFT,提高了频率分辨率,能得到更准确的瞬间频谱Layer II每帧包含1152个时域样本,刚好是Layer I帧的3倍6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准163232子带子带滤波器组滤波器组量化编码量化编码比例因子比例因子计算计算10241024点点FFTFFT心理声学心理声学模型模型动态动态比特分配比特分配复复用用器器PCMPCM输入信号输入信号32323232音频音频码流码流图图6.5 Layer II 6.5 Layer II 音频编码器框图音频编码器框图比例因子比例因子选
12、择选择辅助辅助数据数据编码编码6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准17Layer II的帧结构的帧结构将子带分为低频段、中频段和高频段,采用不同的比特分配策略,描述位分配的位数分别是4、3、2位用共享比例因子的方法提高压缩效率,码流的每帧中有一个2位的比例因子选择信息SCFSI,指出是否需要共享比例因子,以及如何共享比例因子同步头同步头(32bit)(32bit)CRCCRC(16bit)(16bit)位分配位分配SCFSISCFSI(2bit)(2bit)比例因子比例因子(6bit)(6bit)子带子带样本样本子带子带样本样本附加数据附加数据(未指定未指定)低频段低频段4
13、 4位位中频段中频段3 3位位高频段高频段2 2位位6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准18Layer IIILayer III目标码率为每声道64kbps,立体声128kbps采用混合编码技术非均匀量化自适应分割熵编码(哈夫曼编码)更好的临界频带滤波器多相/MDCT混合滤波器组心理声学模型除了使用频域掩蔽特性和时域掩蔽特性之外,还考虑了立体声声道之间的冗余6.2.1 MPEG-1音频压缩编码标准音频压缩编码标准196.2.2 MPEG-2音频压缩编码标准音频压缩编码标准MEPG-2MEPG-2的音频标准的音频标准(ISO(ISOIEC DIS 13818-3)IEC DI
14、S 13818-3)它它是建立在是建立在MEPG-1MEPG-1音频标准音频标准(1SO(1SOIEC11172-3)IEC11172-3)的基础之上的的基础之上的与与MPEG-1 MPEG-1 音频兼容音频兼容前向兼容:前向兼容:MPEG-2MPEG-2音频解码器可以解码音频解码器可以解码MPEG-1MPEG-1音频流音频流后向兼容:后向兼容:MPEG-1MPEG-1音频解码器可以解码音频解码器可以解码MPEG-2MPEG-2音频流音频流在功能与性能上做扩充在功能与性能上做扩充增加了低取样率:取样率增加了低取样率:取样率16k16k,22.05k22.05k,24k24k增加了输出速率:从增
15、加了输出速率:从3232384kbps384kbps增加到增加到8 8640kbps640kbps增加了声道数,可支持增加了声道数,可支持5.15.1和和7.17.1声道。图声道。图6.10 6.10 支持多语言配音,最多支持多语言配音,最多7 7种种20图6.10 5.1声道和7.1声道示意图(a)51声道(b)71声道6.2.2 MPEG-2音频压缩编码标准音频压缩编码标准21图6.11 MPEG-2音频编、解码器框图MPEG-1编码器L LR RC CLSLSRSRSLTELTE扩展编码器L L0 0向向 R R0 0下下 T2T2混混 T3T3合合 T4T4LTELTEMPEG-1解码
16、器L LR RC CLSLSRSRSLTELTE扩展解码器L L0 0重重 R R0 0新新 T2T2混混 T3T3合合 T4T4LTELTEMPEG-2编码器MPEG-2解码器6.2.2 MPEG-2音频压缩编码标准音频压缩编码标准22MPEG-2MPEG-2音频帧结构音频帧结构L0和R0编码以后作为MPEG-1编码数据其他信息编码后作为附加数据放在mpeg-1的帧中,MPEG-1音频数据帧中对辅助数据AUX的长度没有限制MPEG-1帧头MPEG-1CRCMPEG-1声音数据MPEG-2多声道扩展数据MPEG-1AUX图6.12 MPEG-2音频数据的帧结构6.2.2 MPEG-2音频压缩编
17、码标准音频压缩编码标准236.2.3 MPEG-2 AAC音频压缩编码标准音频压缩编码标准l高级音频编码高级音频编码 AACAAC(Advanced Audio CodingAdvanced Audio Coding)l AAC是1997年国际标准组织(ISOIEC)制定的音频编码标准,也是MPEG-2标准的一个部分,标准号为MPEG-2 AAC(ISOIEC l3818-7)。l 与MPEG-1 音频不兼容,压缩效率比MPEG-1/2 音频L2压缩效率提高一倍,比MP3(Layer III)高大约30%,压缩比可达30:1l以每个声道64kbs的码率提供极高质量的音频,很难区分与原始音的差别
展开阅读全文