第十一章声码器和混合编码课件.ppt

上传人（卖家）：晟晟文业

文档编号：4644501

上传时间：2022-12-28

格式：PPT

页数：83

大小：10.41MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《第十一章声码器和混合编码课件.ppt》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第十一声码混合编码课件

资源描述：: 1、第第10章章语音编码语音编码(1)波形编码波形编码v概述及分类概述及分类v脉冲编码调制脉冲编码调制PCMv预测编码及其自适应预测编码及其自适应APCv自适应差分脉冲编码调制自适应差分脉冲编码调制ADPCM及自适应增量调及自适应增量调制制ADMv子带编码子带编码SBCv自适应变换编码自适应变换编码ATC概述概述语音编码：语音编码：Speech Coding,在语音通信及人类信息交流中占举足在语音通信及人类信息交流中占举足轻重的地位。研究对语音信号进行压缩传输、存储等内容。目前数轻重的地位。研究对语音信号进行压缩传输、存储等内容。目前数字通信得以广泛应用，语音编码是将模拟语音数字化的手段。字通信
2、得以广泛应用，语音编码是将模拟语音数字化的手段。将语音信号编码为二进制数字序列，最简单的方法是对其直接进行将语音信号编码为二进制数字序列，最简单的方法是对其直接进行模模/数变换；只要取样率足够高，量化每个样本的比特数足够多，数变换；只要取样率足够高，量化每个样本的比特数足够多，则可以保证解码恢复的语音信号有很好的音质，不会丢失有用信息。则可以保证解码恢复的语音信号有很好的音质，不会丢失有用信息。然而对语音信号直接数字化所需的数码率太高，例如，普通的电话通信中采用8kHz取样率，如用12bit进行量化，则数码率为96kbit/s。这样大的数码率即使对很大容量的传输信道也是难以承受的，因而必须对语
3、音信号进行压缩编码。概述概述语音编码语音编码目的目的：在保持可以接受的失真的情况下，采用尽可能少的：在保持可以接受的失真的情况下，采用尽可能少的比特数表示语音，即减少传输码率或存储量。比特数表示语音，即减少传输码率或存储量。编码后同样的信道容量能传输更多路的信号，因而这类编码又称编码后同样的信道容量能传输更多路的信号，因而这类编码又称为为压缩编码压缩编码，压缩编码需要在，压缩编码需要在保持可懂度与音质保持可懂度与音质、降低数码率降低数码率和和降低编码过程的计算代价降低编码过程的计算代价三方面折衷。三方面折衷。传输码率传输码率：也称为也称为数码率数码率，指传输每秒钟语音信号所需要的比特，指传输每
4、秒钟语音信号所需要的比特数。数。波形编码波形编码语音编码分类语音编码分类：波形编码，：波形编码，Waveform Coder;参数编码，参数编码，Parametric Coder;混合编码，混合编码，Hybrid Coder特点特点：针对语音波形进行编码，尽量保持输入波形不变，即恢复：针对语音波形进行编码，尽量保持输入波形不变，即恢复的语音信号基本上与输入的语音信号波形相同。的语音信号基本上与输入的语音信号波形相同。优缺点优缺点：具有适应能力强、语音质量好等优点，缺点是需要的编：具有适应能力强、语音质量好等优点，缺点是需要的编码速率高。码速率高。典型的编码方式典型的编码方式：脉冲编码调制：脉冲
5、编码调制PCM、自适应差分脉冲编码调制、自适应差分脉冲编码调制ADPCM、子带编码、子带编码SBC等。等。在在16-64kbit/s的数码率上能给出高的编码质量，当数码率进一步的数码率上能给出高的编码质量，当数码率进一步降低时，其性能下降较快。降低时，其性能下降较快。声码器声码器：即：即参数编码参数编码特点特点：先对语音信号进行分析，提取出其参数，对参数进行编码，先对语音信号进行分析，提取出其参数，对参数进行编码，解码后这些参数重新合成出重构的语音信号。力图使重建的语音解码后这些参数重新合成出重构的语音信号。力图使重建的语音信号具有尽可能高的可懂度，而不必保持波形的一致。信号具有尽可能高的可懂
6、度，而不必保持波形的一致。优缺点优缺点：优点是编码速率低，可以低到优点是编码速率低，可以低到2.4kbps甚至以下，缺点是甚至以下，缺点是合成语音质量差，特别是自然度低，处理复杂。合成语音质量差，特别是自然度低，处理复杂。典型的编码方式典型的编码方式：如通道声码器、相位声码器、同态声码器、线性如通道声码器、相位声码器、同态声码器、线性预测声码器等。预测声码器等。混合编码混合编码特点特点：上述两类方法的有机结合，与参数编码相同的是，它也是基：上述两类方法的有机结合，与参数编码相同的是，它也是基于语音产生模型的假定并采用了分析合成技术，但同时它又利用了于语音产生模型的假定并采用了分析合成技术，但同
7、时它又利用了语音的时间波形信息，增强了重建语音的自然度，使得语音质量有语音的时间波形信息，增强了重建语音的自然度，使得语音质量有明显的提高，代价是编码速率相应上升，一般在明显的提高，代价是编码速率相应上升，一般在16-2.4Kbps之间。之间。典型的编码方式典型的编码方式：多脉冲激励线性预测编码：多脉冲激励线性预测编码MPLPC、规则脉冲激励、规则脉冲激励线性预测编码线性预测编码RPE-LPC、码本激励线性预测编码、码本激励线性预测编码CELP等等按传输码率分类按传输码率分类高速率语音编码高速率语音编码：速率：速率32kbit/s以上以上,PCM,64kbit/s,主主要用于公用电话网要用于公
8、用电话网;中高速率语音编码中高速率语音编码：速率：速率16-32kbit/s,ADPCM,32kbit/s,主要用于公用网主要用于公用网;中速率语音编码中速率语音编码：速率：速率4.8-16kbit/s,GSM用的用的RPE/LTP 13kbit/s、VSELP,8kbit/s主要用于数字移动通信话音邮主要用于数字移动通信话音邮件件;低速率语音编码低速率语音编码：速率：速率1.2-4.8kbit/s,CELP,4.8kb/s、LPC,1.2kb/s,主要用于保密话音主要用于保密话音;极低速率语音编码极低速率语音编码：速率：速率1.2kbit/s以下以下脉冲编码调制脉冲编码调制PCM波形编码方式
9、的最简单形式是脉冲编码调制脉冲编码调制(Pulse code modulation,简称PCM)。它直接把语音信号进行采样量化，表示成二进制数字信号，并通过并-串转换过程转换成串行的脉冲，并用脉冲对采样幅度进行编码，以便于传输和存储。它没有利用语音信号的冗余度，所以信号没有得到压缩，编码效它没有利用语音信号的冗余度，所以信号没有得到压缩，编码效率很低。率很低。一般，一般，PCM有均匀有均匀PCM、非均匀、非均匀PCM和自适应和自适应PCM几种形式几种形式模拟语音信号数字语音编码抗混叠滤波采样量化编码A/D转换1.均匀均匀PCM：不论信号幅度的大小，它都采用同等的量化阶距不论信号幅度的大小，它
10、都采用同等的量化阶距进行量化，即采用均匀量化。进行量化，即采用均匀量化。2.非均匀非均匀PCM：从观测到的语音信号概率密度可知，语音信号大量集中在低幅度上。因而，可以利用非均匀量化来弥补均匀量化的缺点。来弥补均匀量化的缺点。非均匀量化的基本思想是对大幅度的样本使用大的，对小幅度的样本使用小的；在接收端按此还原。PCM的量化方式的量化方式均匀量化与非均匀量化国际上采用两种非均匀量化方法：A律和律改变量化阶大小的方法有两种：一种称为前向自适应改变量化阶大小的方法有两种：一种称为前向自适应(forward adaptation)，另一种称为后向自适应，另一种称为后向自适应(backward ad
11、aptation)。3.自适应自适应PCM(APCM)：PCM在量化间隔上存在矛盾：为适应大的幅值要用大的，但为了提高信噪比又希望用小的。除了前面介绍的非均匀量化外，还有一种是采用自适应方法，称为自适应PCM（adaptive PCM，简称APCM）。自适应脉冲编码调制自适应脉冲编码调制(APCM)是根据是根据输入信号幅度大小来改变量输入信号幅度大小来改变量化阶大小化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应，的一种波形编码技术。这种自适应可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即量化阶的大小在较
12、长时间周期里发生变化。量化阶的大小在较长时间周期里发生变化。前向是指(n)是由估计输入信号而得到的，而后向是指由估计量化器的输出前向自适应是根据未量化的样本值的均方根值来估算输入信号的电平，以此来确定量化阶的大小，并对其电平进行编码作为边信息(side information)传送到接收端。其特点是使用原始信号提取预测系数，精度比较高，预测的效果好。但是需要将预测器系数用边信息传送到接收端的解码器，从而减小了差值信号量化的有效比特数，处理的延时比较大。后向自适应是从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶，所以它不需要传送边信息。后向自适应预测利用量化
13、后的信号提取预测信号，避免了前向自适应预测的缺点，但是由于存在量化噪声，使得预测系数的提取精度收到一定的影响。预测编码及其自适应预测编码及其自适应APC在第六章中我们详细讨论了线性预测分析原理，利用线性预测可以改进编码中的量化器性能，因为预测误差e(n)的动态范围和平均能量均比信号x(n)小，如果对e(n)进行量化和编码，则量化bit数将减少。在接收端，只要使用与发送端相同的预测器，就可恢复原信号x(n)。基于这种原理的编码方式称为预测编码(predictive coding，简称PC)当预测系数是自适应随语音信号变化时，又称为自适应预测编码自适应预测编码(Adaptive PC，简称APC)
14、。)()()(nxnxne语音数据流一般分为10 20 ms相继的帧，而预测器系数（或其等效参数）则与预测误差一起传输。在接收端，用由预测器系数控制的逆滤波器再现语音。采用自适应技术后，预测器P(z)要自适应变化，以便与信号匹配。自适应差分脉冲编码调制自适应差分脉冲编码调制ADPCM及自适应增及自适应增量调制量调制ADM在DM中，与量化阶梯相比，当语音波形幅度发生急剧变化时，译码波形不能充分跟踪这种急剧的变化而必然产生失真，这称为斜率过载斜率过载。相反地，在没有输入语音的无声状态时，或者是信号幅度为固定值时，量化输出都将呈现0、1交替的序列，而译码后的波形只是的重复增减。这种噪声称为颗粒噪声颗
15、粒噪声，它给人以粗糙的噪声感觉。为了减少斜率过载失真，必须把设计得大一些；但是过大，又增加了颗粒噪声。因此，兼顾两方面要求，需按均方量化误差为最小（即使两种失真均减至最小）来选择。即采用随输入波形自适应地改变大小的自适应编码方式，使值随信号平均斜率而变化；斜率大时，自动增大；反之则减小。这就是自适应增量调制（Adaptive，DM，简称ADM）。2.自适应增量调制自适应增量调制ADM引入自适应技术后、ADM大约可增多10dB的增益。实验表明，取样率为56kHz时ADM具有与取样率为8kHz时的7bit对数PCM相同的语音质量。差分脉冲编码调制DPCM 降低传输比特率的一种方法是减少必须编码的信
16、息量，这要利用语音信号中大量的冗余度。在相邻的语音样本之间存在着明显的相关性，因此，对相邻样本间的差信号（差分）进行编码，便可谋求信息量的压缩，因为差分信号比原语音信号的动态范围和平均能量都小。这种编码称为差分脉冲编码调制差分脉冲编码调制（Differential PCM，简称DPCM）。DPCM实质上是预测编码APC的一种特殊情况，是最简单的一阶线性预测，即 A(z)=1 a1z-1 当a1=1时，被量化的编码是e(n)x(n)-x(n-1)DPCM编码的原理编码的原理量化器编码器预测器+-)(ndq)(nd)(ns)(nI)(nsp)(nsr的代码。是是量化后的差值信号，积累。构可以避免量
17、化误差的采用这种结系统是一个反馈系统，中产生的量化误差。来补偿过去编码信号进行量化编码，用实际上就是对这个差值系统。为差值信号或余量信号是预测误差信号，也称是预测语音信号，入信号。下一个信号估计值的输预测器确定是重建语音信号，作为是输入语音信号，)()()()()()()(ndnIndDPCMDPCMndnsnsnsqqpr解码器预测器+)(nI)(ndq)(nsp)(nsr由于a1是固定的，显然它不可能对所有讲话者和所有语音内容都是最佳的，如果采用高阶（p 1）的固定顶测，改善效果并不明显；比较好的方法是采用高阶自适应预测。采用自适应量化及高阶自适应预测的DPCM称为ADPCM，它本质上也是
18、一种APC。CCITT（国际电报电话咨询委员会）在1984年提出的32kbit/s编码器建议（G721），就是采用ADPCM作为长途传输中一种新的国际通用语音编码方案。这种ADPCM可达到标准kbit/sPCM的语音传输质量，并具有很好的抗误码性能。子带编码子带编码SBC带通滤波频率搬移量化编码带通滤波频率搬移量化编码量化编码频率搬移带通滤波合路112 wfs222 wfsMw1w2ws(n)发信码子带编码（Sub-Band Coding，简称SBC）也称为频带分割编码首先使用带通滤波器组将语音信号分割成若干个频段也称为子带，然后用调制的方法对滤波后的信号即子带信号进行频谱平移变成低通信号（
19、即基带信号），以利于降低取样率进行抽取；再利用奈奎斯特速率对其进行取样，最后再进行编码处理。而信号的恢复按与上面完全相反的过程进行。带通滤波频率搬移译码带通滤波频率搬移译码译码频率搬移带通滤波分路112 wfs222 wfsMw1w2wMsMwf 2收信码sr(n)SBC解码器解码器SBC的优点是对应于人的听觉特性，可以比较容易地考虑噪声的抑制；即各子带可以选用不同的量化参数以分别控制其信噪比，满足主观听觉的要求。例如，由于语音能量的不平衡，对于含有基音频率和第一共振峰的低频部分，对语音清晰度等主观品质影响较大，应分配比较多的信息、量化细些；反之，高频部分的量化就可粗些。这样，可以减少量化噪声
20、对听觉的妨害程度，整体上也能降低比特数。另外，量化噪声只能出现在各被分割的频带内，对其他频带没有任何影响，所以可以较容易地控制噪声谱。各子带的带宽可以是相同的也可以是不相同的，相同的称为等带宽子带编码，不同的称为变带宽子带编码。正交镜像滤波器组正交镜像滤波器组自适应变换编码自适应变换编码ATC第11章语音编码（2）-声码器技术及混合编码参数编码也称为模型编码。它是对语音信号建立模型，然后对模型参数或是语音的特征参数进行编码，力图使重建语音信号在听觉上具有尽可能高的清晰度和可懂度。v线性预测声码器线性预测声码器：应用最成功的低速率参数语音编码器。：应用最成功的低速率参数语音编码器。线性预测线性
21、预测分析器分析器编码器编码器音调音调检测器检测器线性预测线性预测合成器合成器解码器解码器)(ns)(ns信道LPC声码器框图11.1 线性预测声码器线性预测声码器v与利用线性预测的波形编码不同的是它的接收端不再利用残差，即不具体恢复与利用线性预测的波形编码不同的是它的接收端不再利用残差，即不具体恢复输入语音的波形，而是直接利用预测系数等参数合成传输语音。输入语音的波形，而是直接利用预测系数等参数合成传输语音。vLPC有作为预测器和作为模型的双重作用。有作为预测器和作为模型的双重作用。1.LPC参数的变换和量化2.变帧率LPC声码器v充分利用了语音信号在时域上的冗余度，尤其是元音和擦音在发音过程
22、中都有充分利用了语音信号在时域上的冗余度，尤其是元音和擦音在发音过程中都有缓变的区间，描述这部分区间的语音不必像一些快变语音那样用很多比特的信缓变的区间，描述这部分区间的语音不必像一些快变语音那样用很多比特的信息量。息量。v语音信号是非平稳的时变信号，波形变化随时间而不同。（清音至浊音的过渡语音信号是非平稳的时变信号，波形变化随时间而不同。（清音至浊音的过渡段，语音特性变化剧烈，理论上应用较短的分析帧，要求段，语音特性变化剧烈，理论上应用较短的分析帧，要求LPC声码器至少每隔声码器至少每隔10ms就发送一帧新的就发送一帧新的LPC参数；而对于浊音部分，在发音过程中有缓变的区间，参数；而对于浊音
23、部分，在发音过程中有缓变的区间，语音信号的频谱特性变化很小，分析帧就可以取长些；在语音活动停顿情况下语音信号的频谱特性变化很小，分析帧就可以取长些；在语音活动停顿情况下更是如此。）更是如此。）v因而可以采用变帧速率的编码技术来降低声码器的平均传输码率。因而可以采用变帧速率的编码技术来降低声码器的平均传输码率。v实现思路实现思路：帧长可保持恒定，不必将每帧：帧长可保持恒定，不必将每帧LPC参数都去编码和传送，合成部参数都去编码和传送，合成部分所需的参数可以通过重复使用其前帧参数或内插的方法获得，可降低平均传分所需的参数可以通过重复使用其前帧参数或内插的方法获得，可降低平均传码率。码率。v关键问题
24、关键问题：需要一种度量方法来确定当前帧参数和上一帧参数之间的差异：需要一种度量方法来确定当前帧参数和上一帧参数之间的差异（距离）。（距离）。11.2 LPC-10编码器编码器 11.3 语音信号的混合编码v 20世纪世纪80年代后期，综合了参数编码低比特率与波形编码高语音质量优点的混年代后期，综合了参数编码低比特率与波形编码高语音质量优点的混合编码得到广泛的使用。合编码得到广泛的使用。v最为典型的就是最为典型的就是CELP模型。它在比特率为模型。它在比特率为4-16Kbps时已经可以得到比其他算法时已经可以得到比其他算法更高的重建语音质量。更高的重建语音质量。v得到最广泛应用的是得到最广泛应用
25、的是LPAS（基于线性预测技术的分析（基于线性预测技术的分析-合成编码方法），通过合成编码方法），通过线性预测确定系统参数，并通过闭环或分析线性预测确定系统参数，并通过闭环或分析-合成方法来确定激励序列。合成方法来确定激励序列。短时预测器：分析语短时预测器：分析语音信号的共振峰结构音信号的共振峰结构（谱包络）（谱包络）长时预测器：分析语长时预测器：分析语音信号的基音结构音信号的基音结构感知加权滤波器：使得量化误差能被高能量的共振峰所掩盖。激励信号依据MSE选择v3种最常见的分析种最常见的分析-合成线性预测编码算法分别是：合成线性预测编码算法分别是：v多脉冲线性预测算法（多脉冲线性预测算法（MP
26、-LPC）v规则脉冲激励线性预测编码（规则脉冲激励线性预测编码（RPE-LPC）v码激励线性预测编码（码激励线性预测编码（CELP）：具有较高质量的合成语音和良好的抗噪性）：具有较高质量的合成语音和良好的抗噪性和多次复接能力，近年很多声码器基于该模型。和多次复接能力，近年很多声码器基于该模型。传统的LPC声码器采用的是二元激励，它将激励源分为清音和浊音；CELP的主要改进是采用矢量量化技术对激励信号编码，将事先经过训练得到的一组码矢量组成一个码本，然后对每一帧语音信号从这组码本中选出一个在感知加权误差最小意义上的最佳码矢作为激励源。用一个固定的随机码本中的码矢量来逼近语音经过短时、用一个固定的
27、随机码本中的码矢量来逼近语音经过短时、长时预测后的余量信号。长时预测后的余量信号。用一个自适应码本中的码矢量来逼近语音的长时周期性（基音）结构；)(ns码本误差最小化索引)(ns)(nSw)(nv)(nx)(nc)(zp)(zA)(zW)(zW)(ne_CELP编码器示意图 CELP模型编码仍基于语音的短时特性，采用模型编码仍基于语音的短时特性，采用LAPS与矢量量化。在编码类型上，与矢量量化。在编码类型上，既采用了类似声源模型的语音合成方法，又做了波形的最佳匹配，所以同时具既采用了类似声源模型的语音合成方法，又做了波形的最佳匹配，所以同时具有参数编码与波形编码的特征，故称为混合编码。有参数编
28、码与波形编码的特征，故称为混合编码。11.4 现代通信中的语音信号编码方法v当前语音编码的研究主要致力于如何在较低数据速率的条件下提高声码器的语当前语音编码的研究主要致力于如何在较低数据速率的条件下提高声码器的语音质量使之尽量接近有线话音质量。音质量使之尽量接近有线话音质量。v目前的系统中，基于算法的算法在语音质量与比目前的系统中，基于算法的算法在语音质量与比特速率间取得了很好的平衡，且适用于变速率编码，抗干扰能力也令人满意，特速率间取得了很好的平衡，且适用于变速率编码，抗干扰能力也令人满意，从而得到了极为广泛的应用。从而得到了极为广泛的应用。7.6.1 EVRC算法基本原理算法基本原理vEV
29、RC采用采用8kHz采样频率的采样频率的16bit线性线性PCM信号作为输入信号，以信号作为输入信号，以20ms(即即160个个采样点采样点)为一帧进行编解码。为一帧进行编解码。v根据输入信号的特点来选择编码速率根据输入信号的特点来选择编码速率变速率编码变速率编码平均比特速率低于平均比特速率低于8kbps。v最后编码结果的比特速率为最后编码结果的比特速率为8.5kbps(全速率全速率)，4kbps(半速率半速率)或或0.8kbps（1/8速速率）。率）。vEVRC使用了使用了3种类型的参数来表征语音模型种类型的参数来表征语音模型线性预测系数、基音参数、激线性预测系数、基音参数、激励信号。励信号
30、。v每一个每一个20ms帧中，它产生帧中，它产生10个个LP系数，并根据编码速率采用不同精度系数，并根据编码速率采用不同精度的矢量量化，并采用相应的比特数表达。的矢量量化，并采用相应的比特数表达。v基音周期估计：采用两步法，先在基音周期估计：采用两步法，先在20ms内开环搜索得到一个最佳基音周内开环搜索得到一个最佳基音周期，然后线性内插得到基音曲线，最后用自适应码本来映射长时相关性。期，然后线性内插得到基音曲线，最后用自适应码本来映射长时相关性。这样可减小基音的比特速率。这样可减小基音的比特速率。v激励信号：激励信号：EVRC采用代数码本。采用代数码本。共振峰合成滤波器自适应码本固定码本随机码
31、矢量增益自适应码矢量增益基音周期固定码本索引)(nET)(nC)(nE)(nSpgcg语音合成示意图编码器示意图信号处理信号处理参数参数短时残差短时残差/速率编码速率编码/速率编码速率编码数码率判别数码率判别长时延迟估计长时延迟估计增益增益)(nS)(nsp采样信号采样信号)(n,10.3,2,11,ia滤波，降噪滤波，降噪7.6.2 EVRC算法概述算法概述编码器示意图预处理预处理参数参数短时残差短时残差/速率编码速率编码/速率编码速率编码数码率判别数码率判别长时延迟估计长时延迟估计增益增益)(nS)(nsp采样信号采样信号)(n,10.3,2,11,ia滤波，降噪滤波，降噪经经8kHz采样
32、，采样，16bit量化后得到的线性量化后得到的线性PCM信号信号s(n)首先被送到预处理模块。在这里经过三级二阶首先被送到预处理模块。在这里经过三级二阶Butterworth滤波器（截止频率滤波器（截止频率120Hz的高通，抑制非人声的造音分量，包括的高通，抑制非人声的造音分量，包括50Hz的交流噪的交流噪声），然后再对语音抑制背景噪声。声），然后再对语音抑制背景噪声。编码器示意图预处理预处理参数参数短时残差短时残差/速率编码速率编码/速率编码速率编码数码率判别数码率判别长时延迟估计长时延迟估计增益增益)(nS)(nsp采样信号采样信号)(n,10.3,2,11,ia滤波，降噪滤波，降噪LPC
33、分析中，仍然采用分析中，仍然采用10阶的自回归模型，阶的自回归模型，LPC系数转换成系数转换成LSP系数。系数。在长时自相关模块中采用自相关法提取基音周期，首先在被在长时自相关模块中采用自相关法提取基音周期，首先在被4倍压缩的语音信号中根据最大相关性倍压缩的语音信号中根据最大相关性找出粗略的基音周期，再在原始的残差信号中找出这帧的精细基音周期。找出粗略的基音周期，再在原始的残差信号中找出这帧的精细基音周期。编码器示意图预处理预处理参数参数短时残差短时残差/速率编码速率编码/速率编码速率编码数码率判别数码率判别长时延迟估计长时延迟估计增益增益)(nS)(nsp采样信号采样信号)(n,10.3,2
34、,11,ia滤波，降噪滤波，降噪数据速率判决模块：根据输入语音的特征来决定语音的编码速率。一般地，全速率对应的是浊音，数据速率判决模块：根据输入语音的特征来决定语音的编码速率。一般地，全速率对应的是浊音，需要最高的比特率；需要最高的比特率；1、8速率通常对应清音，需要最低的比特率；速率通常对应清音，需要最低的比特率；1、2对应的通常是过渡音。对应的通常是过渡音。根据不同的速率，实际是清浊音的判断，采用不同激励源。根据不同的速率，实际是清浊音的判断，采用不同激励源。编码器示意图预处理预处理参数参数短时残差短时残差/速率编码速率编码/速率编码速率编码数码率判别数码率判别长时延迟估计长时延迟估计增益增益)(nS)(nsp采样信号采样信号)(n,10.3,2,11,ia滤波，降噪滤波，降噪清音：随机噪声；浊音和过渡音采用特定的规则信号。清音：随机噪声；浊音和过渡音采用特定的规则信号。EVRC将每帧分为将每帧分为3个子帧，分别为个子帧，分别为53、53、54个样点；以后的编码都是基于子帧的。个样点；以后的编码都是基于子帧的。解码器示意图帧误差检测后向滤波器解码合成语音帧错误主要包括以下几种类型：帧错误主要包括以下几种类型：解码器示意图帧误差检测后向滤波器解码合成语音解码部分解码部分解码器示意图帧误差检测后向滤波器解码合成语音

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第十一章声码器和混合编码课件.ppt
链接地址：https://www.163wenku.com/p-4644501.html

晟晟文业

内容提供者

实名认证

联系作者