第十一章声码器和混合编码课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十一章声码器和混合编码课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一 声码 混合 编码 课件
- 资源描述:
-
1、第第10章章 语音编码语音编码(1)波形编码波形编码v概述及分类概述及分类v脉冲编码调制脉冲编码调制PCMv预测编码及其自适应预测编码及其自适应APCv自适应差分脉冲编码调制自适应差分脉冲编码调制ADPCM及自适应增量调及自适应增量调制制ADMv子带编码子带编码SBCv自适应变换编码自适应变换编码ATC概述概述语音编码:语音编码:Speech Coding,在语音通信及人类信息交流中占举足在语音通信及人类信息交流中占举足轻重的地位。研究对语音信号进行压缩传输、存储等内容。目前数轻重的地位。研究对语音信号进行压缩传输、存储等内容。目前数字通信得以广泛应用,语音编码是将模拟语音数字化的手段。字通信
2、得以广泛应用,语音编码是将模拟语音数字化的手段。将语音信号编码为二进制数字序列,最简单的方法是对其直接进行将语音信号编码为二进制数字序列,最简单的方法是对其直接进行模模/数变换;只要取样率足够高,量化每个样本的比特数足够多,数变换;只要取样率足够高,量化每个样本的比特数足够多,则可以保证解码恢复的语音信号有很好的音质,不会丢失有用信息。则可以保证解码恢复的语音信号有很好的音质,不会丢失有用信息。然而对语音信号直接数字化所需的数码率太高,例如,普通的电话通信中采用8kHz取样率,如用12bit进行量化,则数码率为96kbit/s。这样大的数码率即使对很大容量的传输信道也是难以承受的,因而必须对语
3、音信号进行压缩编码。概述概述语音编码语音编码目的目的:在保持可以接受的失真的情况下,采用尽可能少的:在保持可以接受的失真的情况下,采用尽可能少的比特数表示语音,即减少传输码率或存储量。比特数表示语音,即减少传输码率或存储量。编码后同样的信道容量能传输更多路的信号,因而这类编码又称编码后同样的信道容量能传输更多路的信号,因而这类编码又称为为压缩编码压缩编码,压缩编码需要在,压缩编码需要在保持可懂度与音质保持可懂度与音质、降低数码率降低数码率和和降低编码过程的计算代价降低编码过程的计算代价三方面折衷。三方面折衷。传输码率传输码率:也称为也称为数码率数码率,指传输每秒钟语音信号所需要的比特,指传输每
4、秒钟语音信号所需要的比特数。数。波形编码波形编码语音编码分类语音编码分类:波形编码,:波形编码,Waveform Coder;参数编码,参数编码,Parametric Coder;混合编码,混合编码,Hybrid Coder特点特点:针对语音波形进行编码,尽量保持输入波形不变,即恢复:针对语音波形进行编码,尽量保持输入波形不变,即恢复的语音信号基本上与输入的语音信号波形相同。的语音信号基本上与输入的语音信号波形相同。优缺点优缺点:具有适应能力强、语音质量好等优点,缺点是需要的编:具有适应能力强、语音质量好等优点,缺点是需要的编码速率高。码速率高。典型的编码方式典型的编码方式:脉冲编码调制:脉冲
5、编码调制PCM、自适应差分脉冲编码调制、自适应差分脉冲编码调制ADPCM、子带编码、子带编码SBC等。等。在在16-64kbit/s的数码率上能给出高的编码质量,当数码率进一步的数码率上能给出高的编码质量,当数码率进一步降低时,其性能下降较快。降低时,其性能下降较快。声码器声码器:即:即参数编码参数编码特点特点:先对语音信号进行分析,提取出其参数,对参数进行编码,先对语音信号进行分析,提取出其参数,对参数进行编码,解码后这些参数重新合成出重构的语音信号。力图使重建的语音解码后这些参数重新合成出重构的语音信号。力图使重建的语音信号具有尽可能高的可懂度,而不必保持波形的一致。信号具有尽可能高的可懂
6、度,而不必保持波形的一致。优缺点优缺点:优点是编码速率低,可以低到优点是编码速率低,可以低到2.4kbps甚至以下,缺点是甚至以下,缺点是合成语音质量差,特别是自然度低,处理复杂。合成语音质量差,特别是自然度低,处理复杂。典型的编码方式典型的编码方式:如通道声码器、相位声码器、同态声码器、线性如通道声码器、相位声码器、同态声码器、线性预测声码器等。预测声码器等。混合编码混合编码特点特点:上述两类方法的有机结合,与参数编码相同的是,它也是基:上述两类方法的有机结合,与参数编码相同的是,它也是基于语音产生模型的假定并采用了分析合成技术,但同时它又利用了于语音产生模型的假定并采用了分析合成技术,但同
7、时它又利用了语音的时间波形信息,增强了重建语音的自然度,使得语音质量有语音的时间波形信息,增强了重建语音的自然度,使得语音质量有明显的提高,代价是编码速率相应上升,一般在明显的提高,代价是编码速率相应上升,一般在16-2.4Kbps之间。之间。典型的编码方式典型的编码方式:多脉冲激励线性预测编码:多脉冲激励线性预测编码MPLPC、规则脉冲激励、规则脉冲激励线性预测编码线性预测编码RPE-LPC、码本激励线性预测编码、码本激励线性预测编码CELP等等按传输码率分类按传输码率分类高速率语音编码高速率语音编码:速率:速率32kbit/s以上以上,PCM,64kbit/s,主主要用于公用电话网要用于公
8、用电话网;中高速率语音编码中高速率语音编码:速率:速率16-32kbit/s,ADPCM,32kbit/s,主要用于公用网主要用于公用网;中速率语音编码中速率语音编码:速率:速率4.8-16kbit/s,GSM用的用的RPE/LTP 13kbit/s、VSELP,8kbit/s主要用于数字移动通信话音邮主要用于数字移动通信话音邮件件;低速率语音编码低速率语音编码:速率:速率1.2-4.8kbit/s,CELP,4.8kb/s、LPC,1.2kb/s,主要用于保密话音主要用于保密话音;极低速率语音编码极低速率语音编码:速率:速率1.2kbit/s以下以下脉冲编码调制脉冲编码调制PCM波形编码方式
9、的最简单形式是脉冲编码调制脉冲编码调制(Pulse code modulation,简称PCM)。它直接把语音信号进行采样量化,表示成二进制数字信号,并通过并-串转换过程转换成串行的脉冲,并用脉冲对采样幅度进行编码,以便于传输和存储。它没有利用语音信号的冗余度,所以信号没有得到压缩,编码效它没有利用语音信号的冗余度,所以信号没有得到压缩,编码效率很低。率很低。一般,一般,PCM有均匀有均匀PCM、非均匀、非均匀PCM和自适应和自适应PCM几种形式几种形式模拟语音信号数字语音编码抗混叠滤 波采样量化编码A/D转换1.均匀均匀PCM:不论信号幅度的大小,它都采用同等的量化阶距不论信号幅度的大小,它
10、都采用同等的量化阶距进行量化,即采用均匀量化。进行量化,即采用均匀量化。2.非均匀非均匀PCM:从观测到的语音信号概率密度可知,语音信号大量集中在低幅度上。因而,可以利用非均匀量化来弥补均匀量化的缺点。来弥补均匀量化的缺点。非均匀量化的基本思想是对大幅度的样本使用大的,对小幅度的样本使用小的;在接收端按此还原。PCM的量化方式的量化方式均匀量化与非均匀量化 国际上采用两种非均匀量化方法:A律和 律改变量化阶大小的方法有两种:一种称为前向自适应改变量化阶大小的方法有两种:一种称为前向自适应(forward adaptation),另一种称为后向自适应,另一种称为后向自适应(backward ad
11、aptation)。3.自适应自适应PCM(APCM):PCM在量化间隔上存在矛盾:为适应大的幅值要用大的,但为了提高信噪比又希望用小的。除了前面介绍的非均匀量化外,还有一种是采用自适应方法,称为自适应PCM(adaptive PCM,简称APCM)。自适应脉冲编码调制自适应脉冲编码调制(APCM)是根据是根据输入信号幅度大小来改变量输入信号幅度大小来改变量化阶大小化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较
12、长时间周期里发生变化。量化阶的大小在较长时间周期里发生变化。前向是指(n)是由估计输入信号而得到的,而后向是指由估计量化器的输出前向自适应是根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(side information)传送到接收端。其特点是使用原始信号提取预测系数,精度比较高,预测的效果好。但是需要将预测器系数用边信息传送到接收端的解码器,从而减小了差值信号量化的有效比特数,处理的延时比较大。后向自适应是从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶,所以它不需要传送边信息。后向自适应预测利用量化
13、后的信号提取预测信号,避免了前向自适应预测的缺点,但是由于存在量化噪声,使得预测系数的提取精度收到一定的影响。预测编码及其自适应预测编码及其自适应APC在第六章中我们详细讨论了线性预测分析原理,利用线性预测可以改进编码中的量化器性能,因为预测误差e(n)的动态范围和平均能量均比信号x(n)小,如果对e(n)进行量化和编码,则量化bit数将减少。在接收端,只要使用与发送端相同的预测器,就可恢复原信号x(n)。基于这种原理的编码方式称为预测编码(predictive coding,简称PC)当预测系数是自适应随语音信号变化时,又称为自适应预测编码自适应预测编码(Adaptive PC,简称APC)
14、。)()()(nxnxne语音数据流一般分为10 20 ms相继的帧,而预测器系数(或其等效参数)则与预测误差一起传输。在接收端,用由预测器系数控制的逆滤波器再现语音。采用自适应技术后,预测器P(z)要自适应变化,以便与信号匹配。自适应差分脉冲编码调制自适应差分脉冲编码调制ADPCM及自适应增及自适应增量调制量调制ADM在DM中,与量化阶梯相比,当语音波形幅度发生急剧变化时,译码波形不能充分跟踪这种急剧的变化而必然产生失真,这称为斜率过载斜率过载。相反地,在没有输入语音的无声状态时,或者是信号幅度为固定值时,量化输出都将呈现0、1交替的序列,而译码后的波形只是的重复增减。这种噪声称为颗粒噪声颗
15、粒噪声,它给人以粗糙的噪声感觉。为了减少斜率过载失真,必须把设计得大一些;但是过大,又增加了颗粒噪声。因此,兼顾两方面要求,需按均方量化误差为最小(即使两种失真均减至最小)来选择。即采用随输入波形自适应地改变大小的自适应编码方式,使值随信号平均斜率而变化;斜率大时,自动增大;反之则减小。这就是自适应增量调制(Adaptive,DM,简称ADM)。2.自适应增量调制自适应增量调制ADM引入自适应技术后、ADM大约可增多10dB的增益。实验表明,取样率为56kHz时ADM具有与取样率为8kHz时的7bit对数PCM相同的语音质量。差分脉冲编码调制DPCM 降低传输比特率的一种方法是减少必须编码的信
16、息量,这要利用语音信号中大量的冗余度。在相邻的语音样本之间存在着明显的相关性,因此,对相邻样本间的差信号(差分)进行编码,便可谋求信息量的压缩,因为差分信号比原语音信号的动态范围和平均能量都小。这种编码称为差分脉冲编码调制差分脉冲编码调制(Differential PCM,简称DPCM)。DPCM实质上是预测编码APC的一种特殊情况,是最简单的一阶线性预测,即 A(z)=1 a1z-1 当a1=1时,被量化的编码是e(n)x(n)-x(n-1)DPCM编码的原理编码的原理量化器编码器预测器+-)(ndq)(nd)(ns)(nI)(nsp)(nsr的代码。是是量化后的差值信号,积累。构可以避免量
17、化误差的采用这种结系统是一个反馈系统,中产生的量化误差。来补偿过去编码信号进行量化编码,用实际上就是对这个差值系统。为差值信号或余量信号是预测误差信号,也称是预测语音信号,入信号。下一个信号估计值的输预测器确定是重建语音信号,作为是输入语音信号,)()()()()()()(ndnIndDPCMDPCMndnsnsnsqqpr解码器预测器+)(nI)(ndq)(nsp)(nsr由于a1是固定的,显然它不可能对所有讲话者和所有语音内容都是最佳的,如果采用高阶(p 1)的固定顶测,改善效果并不明显;比较好的方法是采用高阶自适应预测。采用自适应量化及高阶自适应预测的DPCM称为ADPCM,它本质上也是
展开阅读全文