数字音频压缩及标准解析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字音频压缩及标准解析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字音频 压缩 标准 解析 课件
- 资源描述:
-
1、2010年秋北京信息科技大学音频压缩概述音频压缩概述 3.1波形编码波形编码 3.2参数编码参数编码 3.3MPEGMPEG音频编码音频编码 3.5G.7xxG.7xx系列编码标准系列编码标准 3.6混合编码混合编码 3.42010年秋北京信息科技大学了解音频压缩的可行性了解音频压缩的可行性掌握波形编码、参数编码和混合编码的掌握波形编码、参数编码和混合编码的基本知识基本知识熟悉熟悉MPEG音频标准音频标准全面掌握音频压缩编解码技术。全面掌握音频压缩编解码技术。2010年秋北京信息科技大学p根据统计分析结果,音频信号中存在着多种冗余,其主要部分可分别从时域和频域来考虑。p由于音频主要是给人听的,
2、所以考虑人的听觉机理,也能对音频信号实行压缩。2010年秋北京信息科技大学幅度分布的非均匀性幅度分布的非均匀性样值间的相关性样值间的相关性周期之间的相关性周期之间的相关性基音之间的相关性基音之间的相关性静止系数静止系数长时自相关函数长时自相关函数2010年秋北京信息科技大学长时功率谱密度的非均匀性。长时功率谱密度的非均匀性。语音特有的短时功率谱密度。语音特有的短时功率谱密度。2010年秋北京信息科技大学掩蔽效应掩蔽效应对不同频段的敏感性对不同频段的敏感性对音频信号相位变化不敏感对音频信号相位变化不敏感2010年秋北京信息科技大学基于音频数据的统计特性进行编码,典基于音频数据的统计特性进行编码,
3、典型技术是波形编码。型技术是波形编码。基于音频的声学参数,进行参数编码,基于音频的声学参数,进行参数编码,可进一步降低数据率。可进一步降低数据率。基于人的听觉特性进行编码。基于人的听觉特性进行编码。2010年秋北京信息科技大学时域编码、频域编码和统计编码。时域编码、频域编码和统计编码。原理:原理:p依据声音信号的冗余度以及人耳听觉的声掩依据声音信号的冗余度以及人耳听觉的声掩蔽,将人耳听觉觉察不到的分量去掉,降低蔽,将人耳听觉觉察不到的分量去掉,降低编码后的数据比特率。编码后的数据比特率。2010年秋北京信息科技大学按解码后数据与原始数据是否完全一致、按解码后数据与原始数据是否完全一致、质量有无
4、损失的标准质量有无损失的标准p无损压缩编码无损压缩编码(无失真)(无失真)p有损压缩编码有损压缩编码(有失真)(有失真)2010年秋北京信息科技大学统计编码统计编码波形编码波形编码参数编码参数编码混合编码混合编码感知编码感知编码2010年秋北京信息科技大学类类 别别算算 法法名名 称称标标 准准数数 据据 率率应应 用用波形编码波形编码PCMPCM脉冲编码调制脉冲编码调制公用电公用电话网话网ISDNISDN-law-law,A-lawA-law律,律,A A律律G.711G.71164kbit/s64kbit/sAPCMAPCM自适应脉冲编码调制自适应脉冲编码调制DPCMDPCM差分脉冲编码调
5、制差分脉冲编码调制ADPCMADPCM自适应自适应DPCMDPCMG.721G.72132kbit/s32kbit/sSB-ADPCMSB-ADPCM子带子带-自适应自适应DPCMDPCMG.722G.72264kbit/s64kbit/s参数编码参数编码LPCLPC线性预测编码线性预测编码2.4kbit/s2.4kbit/s保密话音保密话音混合编码混合编码CELPCCELPC码激励码激励LPCLPC4.6kbit/s4.6kbit/s移动通信移动通信VSELPVSELP向量和激励向量和激励LPCLPC8kbit/s8kbit/sRPE-LTPRPE-LTP规则码激励长时预测规则码激励长时预测
6、13.2kbit/s13.2kbit/s语音信箱语音信箱LD-CELPLD-CELP低延时码激励低延时码激励LPCLPCG.728G.72816kbit/s16kbit/sISDNISDNACELPACELP自适应自适应CELPCELPG.723.1G.723.15.3 kbit/s5.3 kbit/sPSTNPSTNCSA-CELPCSA-CELP共轭结构代数共轭结构代数-CELP-CELPG.729G.7298kbit/s8kbit/s移动通信移动通信感知编码感知编码MPEG-MPEG-音频音频多子带,感知编码多子带,感知编码128 kbit/s128 kbit/sVCD/DVDVCD/D
7、VDDolbyAC-3DolbyAC-3感知编码感知编码DVDDVD表表3-13-1编码的分类及标准编码的分类及标准2010年秋北京信息科技大学 将时间域信号直接变换为数字代码将时间域信号直接变换为数字代码p由于保留了信号原始样值的细节变化,从而由于保留了信号原始样值的细节变化,从而保留了信号的各种过渡特征,所以解码音频保留了信号的各种过渡特征,所以解码音频信号质量一般较高。信号质量一般较高。p不足之处:传输码率比较高,压缩比不大。不足之处:传输码率比较高,压缩比不大。2010年秋北京信息科技大学Pulse Code Modulation,PCM,简称脉码,简称脉码调制。调制。PCM是各种数字
8、编码系统中最规范的方法,是各种数字编码系统中最规范的方法,也是应用最广泛的系统。也是应用最广泛的系统。除了增量调制外,各种波形编码器都包含有除了增量调制外,各种波形编码器都包含有PCM的编码与译码部分。的编码与译码部分。2010年秋北京信息科技大学PCM是是“数字化数字化”的最基本的技术的最基本的技术p通过抽样、量化和编码通过抽样、量化和编码3个步骤,用若干代码表个步骤,用若干代码表示模拟形式的信息信号(如图像、声音信号),示模拟形式的信息信号(如图像、声音信号),再用脉冲信号表示这些代码来进行传输再用脉冲信号表示这些代码来进行传输/存储。存储。2010年秋北京信息科技大学 PCM编码是一种最
9、通用的无压缩编码。编码是一种最通用的无压缩编码。p优点:保真度高,解码速度快优点:保真度高,解码速度快p缺点:编码后的数据量大。缺点:编码后的数据量大。pCD-DA采用的就是这种编码方式。采用的就是这种编码方式。若利用样值之间的相关性,即记录取样值之间的若利用样值之间的相关性,即记录取样值之间的差值,就称为差分差值,就称为差分PCM(DPCM)。)。DPCM方式方式是非常适合自然界规律的。是非常适合自然界规律的。2010年秋北京信息科技大学图图3-7 DPCM3-7 DPCM编码编码2010年秋北京信息科技大学图图3-8 DPCM3-8 DPCM解码解码2010年秋北京信息科技大学图图3-9
10、PCM3-9 PCM与与DPCMDPCM的电平分布的电平分布2010年秋北京信息科技大学1自适应自适应PCMp自适应自适应PCM(APCM):根据邻近信号的性):根据邻近信号的性质使量化步长改变的编码。质使量化步长改变的编码。p准瞬时压扩和动态加重就可以看做是一种准瞬时压扩和动态加重就可以看做是一种APCM。2010年秋北京信息科技大学图图3-11 APCM3-11 APCM组成框图组成框图2010年秋北京信息科技大学DPCMDPCM码码系系 数数正值正值0110110100100010010000001.751.751.251.250.90.90.90.9负值负值11111111011010
11、11011001000.90.90.90.91.251.251.751.75表表3-23-23 3位位APCMAPCM的系数法的系数法2010年秋北京信息科技大学把自适应型量化步长引入差分把自适应型量化步长引入差分PCM(DPCM)。)。p不是把信号不是把信号x(n)直接量化直接量化p而是把它和预测值而是把它和预测值x(n)的差的差d(n)进行量化进行量化p比前述的比前述的APCM效率高,中等质量的高效率编效率高,中等质量的高效率编码。码。2010年秋北京信息科技大学 应用:应用:p多功能电话机的留言录音等短时间录音多功能电话机的留言录音等短时间录音p不同磁带的固体录音机和向导广播不同磁带的固
12、体录音机和向导广播p自动售货机自动售货机p多媒体技术应用领域的多媒体技术应用领域的CD-I中,也采用中,也采用48位的位的ADPCM。2010年秋北京信息科技大学图图3-12 ADPCM3-12 ADPCM原理框图原理框图2010年秋北京信息科技大学位位 数数APCMAPCMADPCMADPCM2 20.60.6,2.22.20.80.8,1.61.63 30.850.85,1 1,1 1,1.51.50.90.9,0.90.9,1.251.25,1.751.754 40.80.8,0.80.8,0.80.8,0.80.8,1.21.2,1.61.6,2.02.0,2.42.40.90.9,0
13、.90.9,0.90.9,0.90.9,1.21.2,1.61.6,2.02.0,2.42.45 50.850.85,0.850.85,0.850.85,0.850.85,0.850.85,0.850.85,0.850.85,0.850.85,1.21.2,1.41.4,1.61.6,1.81.8,2.02.0,2.22.2,2.42.4,2.62.60.90.9,0.90.9,0.90.9,0.90.9,0.950.95,0.950.95,0.950.95,0.950.95,1.21.2,1.51.5,1.81.8,2.12.1,2.42.4,2.72.7,3.03.0,3.33.3表表3-
14、33-3 自适应量化法中的量化级系数自适应量化法中的量化级系数2010年秋北京信息科技大学增量调制(增量调制(M)pDelta Modulationp是用一位二进制码表示相邻模拟抽样值相对是用一位二进制码表示相邻模拟抽样值相对大小的大小的A/D转换方式转换方式p量化只限于正和负两个电平,只用一比特传量化只限于正和负两个电平,只用一比特传输一个样值。输一个样值。pM是增量调制方式的代号。是增量调制方式的代号。2010年秋北京信息科技大学图图3-13 3-13 简单增量调制原理图简单增量调制原理图图中图中x(t)是是一模拟信号,一模拟信号,x(t)为本地为本地译码器输出译码器输出的前一时刻的前一时
15、刻的量化信号。的量化信号。2010年秋北京信息科技大学图图3-14 M3-14 M编码原理编码原理2010年秋北京信息科技大学收到收到l码后产生一个正斜率电压,在码后产生一个正斜率电压,在TS=T时间内均匀上升一个量阶,时间内均匀上升一个量阶,收到一个收到一个0码产生一个负的斜变电压,在码产生一个负的斜变电压,在TS时间内均匀下降一个量阶时间内均匀下降一个量阶这样把二进制代码经过译码后变为锯齿这样把二进制代码经过译码后变为锯齿波。波。()x t2010年秋北京信息科技大学传码率及信号带宽传码率及信号带宽量化信噪比量化信噪比误码信噪比误码信噪比设备复杂性设备复杂性2010年秋北京信息科技大学是一
16、种改进型的增量调制方式是一种改进型的增量调制方式它的量化级它的量化级随着音节时间间隔(随着音节时间间隔(520ms)中)中信号平均斜率而变化。这里的音节相当于语音信号平均斜率而变化。这里的音节相当于语音浊音准周期信号的基音周期。浊音准周期信号的基音周期。由于信号的平均斜率是根据检测码流中连由于信号的平均斜率是根据检测码流中连“1”或连或连“0”的个数确定的,所以又称数字检测、的个数确定的,所以又称数字检测、连续可变斜率增量调制(连续可变斜率增量调制(CVSD),简称数字压),简称数字压扩增量调制。扩增量调制。2010年秋北京信息科技大学图图3-15 3-15 数字检测音节压扩数字检测音节压扩M
17、M组成框图组成框图2010年秋北京信息科技大学自适应自适应M与简单与简单M相比,编码器能正常工作相比,编码器能正常工作的动态范围有很大提高,信噪比比简单的动态范围有很大提高,信噪比比简单M优优越。越。这种优越性与两个参数有关,这种优越性与两个参数有关,p数字检测的连码数数字检测的连码数m,其值越大,改善越大;,其值越大,改善越大;p脉冲压缩比脉冲压缩比=0/max,其中,其中max为最大量化级,为最大量化级,0是最小量化级(无控制的),是最小量化级(无控制的),越小改善越大。越小改善越大。2010年秋北京信息科技大学SBC是将一个短周期内的连续时间取样信号是将一个短周期内的连续时间取样信号送入
18、滤波器中,滤波器组将信号分成多送入滤波器中,滤波器组将信号分成多个(最多个(最多32个)限带信号,以近似人耳个)限带信号,以近似人耳的临界频段响应。的临界频段响应。2010年秋北京信息科技大学由滤波器组的锐截止频率来仿效临界频段响应,由滤波器组的锐截止频率来仿效临界频段响应,并在带宽内限制量化噪声。并在带宽内限制量化噪声。子带编码要求处理延迟必须足够小,以使量化子带编码要求处理延迟必须足够小,以使量化噪声不超出人耳的瞬时限制。噪声不超出人耳的瞬时限制。子带编码通过分析每个子带的取样值并与心理子带编码通过分析每个子带的取样值并与心理声学模型进行比较,编码器基于每个子带的掩声学模型进行比较,编码器
19、基于每个子带的掩蔽阈值能自适应地量化取样值。蔽阈值能自适应地量化取样值。2010年秋北京信息科技大学子带编码中,每个子带都要根据所分配的不同子带编码中,每个子带都要根据所分配的不同比特数来独立进行编码。比特数来独立进行编码。在任何情况下,每个子带的量化噪声都会增加。在任何情况下,每个子带的量化噪声都会增加。当重建信号时,每个子带的量化噪声被限制在当重建信号时,每个子带的量化噪声被限制在该子带内。该子带内。由于每个子带的信号会对噪声进行掩蔽,所以由于每个子带的信号会对噪声进行掩蔽,所以子带内的量化噪声是可以容忍的。子带内的量化噪声是可以容忍的。2010年秋北京信息科技大学图图3-16 3-16
20、生成窄带高分辨率的子带编码生成窄带高分辨率的子带编码2010年秋北京信息科技大学子带编码的主要特点:子带编码的主要特点:p每个子带对每一块新的数据都要重新计算,并每个子带对每一块新的数据都要重新计算,并根据信号和噪声的可听度对取样值进行动态量根据信号和噪声的可听度对取样值进行动态量化。化。p子带感知编码器利用数字滤波器组将短时的音子带感知编码器利用数字滤波器组将短时的音频信号分成多个子带(对于时间取样值可以采频信号分成多个子带(对于时间取样值可以采用多种优化编码方法)。用多种优化编码方法)。2010年秋北京信息科技大学子带编码的主要特点:子带编码的主要特点:p每个子带的峰值功率与掩蔽级的比率由
21、所做的每个子带的峰值功率与掩蔽级的比率由所做的运算来决定,即根据信号振幅高于可听曲线的运算来决定,即根据信号振幅高于可听曲线的程度来分配量化所需的比特数。程度来分配量化所需的比特数。p给每一个子带分配足够的位数来保证量化噪声给每一个子带分配足够的位数来保证量化噪声处于掩蔽级以下。处于掩蔽级以下。2010年秋北京信息科技大学图图3-17 SB-ADPCM3-17 SB-ADPCM编、译码方框图编、译码方框图2010年秋北京信息科技大学标量量化(标量量化(SQ)p独立地对一个样值量化编码的方式。独立地对一个样值量化编码的方式。p由于对每一个样值单独编码处理,使系统码率由于对每一个样值单独编码处理,
22、使系统码率不可能低于取样频率。不可能低于取样频率。矢量量化(矢量量化(VQ)p对若干个音频样值一起量化编码对若干个音频样值一起量化编码2010年秋北京信息科技大学图图3-18 VQ3-18 VQ的基本原理的基本原理2010年秋北京信息科技大学图图3-19 3-19 最优码字搜索算法一例最优码字搜索算法一例2010年秋北京信息科技大学参数编码技术以语音信号产生的数学模型为基参数编码技术以语音信号产生的数学模型为基础,根据输入语音信号分析出表征声门振动的础,根据输入语音信号分析出表征声门振动的激励参数和表征声道特性的声道参数,然后在激励参数和表征声道特性的声道参数,然后在解码端根据这些模型参数来恢
23、复语音。解码端根据这些模型参数来恢复语音。这种编码算法并不忠实地反映输入语音的原始这种编码算法并不忠实地反映输入语音的原始波形,而是着眼于人耳的听觉特性,确保解码波形,而是着眼于人耳的听觉特性,确保解码语音的可懂度和清晰度。语音的可懂度和清晰度。2010年秋北京信息科技大学 基于参数编码技术的编码系统一般称之为声码器,基于参数编码技术的编码系统一般称之为声码器,主要用在窄带信道上提供主要用在窄带信道上提供4.8kbit/s以下的低速率语以下的低速率语音通信和一些对时延要求较宽的场合。音通信和一些对时延要求较宽的场合。当前参数编码技术主要的研究方向是线性预测当前参数编码技术主要的研究方向是线性预
24、测(Linear Predictive Coder,LPC)声码器和余弦声)声码器和余弦声码器。码器。2010年秋北京信息科技大学参数编码的基础是人类语音的生成模型。参数编码的基础是人类语音的生成模型。语音学和医学的研究结果表明,人类发音器官产生语音学和医学的研究结果表明,人类发音器官产生声音的过程可以用一个数学模型来逼近。声音的过程可以用一个数学模型来逼近。p人的语音发声过程是:气流从肺呼出后经过声门时受声人的语音发声过程是:气流从肺呼出后经过声门时受声带作用,形成激励气流,再经过由口腔、鼻腔和嘴组成带作用,形成激励气流,再经过由口腔、鼻腔和嘴组成的声道的作用而发出语音。的声道的作用而发出语
25、音。p从声门出来的气流相当于激励信号,而声道可以等效成从声门出来的气流相当于激励信号,而声道可以等效成一个全极点滤波器,称为声道滤波器或合成滤波器。一个全极点滤波器,称为声道滤波器或合成滤波器。p在讲话过程中激励信号和滤波器系数不断地变化,从而在讲话过程中激励信号和滤波器系数不断地变化,从而发出不同的声音。发出不同的声音。2010年秋北京信息科技大学通常认为激励信号和滤波器系数通常认为激励信号和滤波器系数540 ms更新一次。更新一次。p人们在发声母时,声带不振动,激励信号类似白噪声,人们在发声母时,声带不振动,激励信号类似白噪声,将这类声音称做清音;将这类声音称做清音;p发韵母时,声带振动,
展开阅读全文