语音增强教程课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语音增强教程课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 增强 教程 课件
- 资源描述:
-
1、第15章 语音增强第1页,共26页。目录n15.1 概 述n15.2语音特性、人耳感知特性及噪声特性15.2.1 语音特性15.2.2人耳感知特性15.2.3噪声特性n15.3滤波器法15.3.1固定滤波器15-.3.2自适应滤波15.3.3变换技术n15.4非线性处理15.4.1 中心削波15.4.2同态滤波法n15.5减谱法15.5.1减谱法15.5.2减谱法的改进形式n15.6自相关相减法n15.7自适应噪声对消15.7.1自适应滤波15.7.2具有参考信号的自适应噪声对消15.7.3利用延迟来建立参考信号的自适应噪声对消第2页,共26页。15.1 概 述 n语音增强是解决噪声污染的一种
2、有效方法,它的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音,即去掉语音信号中的噪声和干扰,改善它的质量。n语音增强是语音信号处理系统的重要组成部分。n各种增强方法各有长处并且适用于不同的应用场合。第3页,共26页。15.1 概 述语音增强的目的主要有两个:n一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳,这是一种主观度量;n二是提高语音可懂度,这是一种客观度量。这两个目的往往不能兼得。第4页,共26页。语音增强方法 语音增强方法有多种,大致分为三类:基于语音产生模型 如:线性滤波法、梳状滤波法、自相关法 基于语音模型和噪声模型 如:维纳滤波法、卡尔曼滤波法 基于噪声特性(
3、短时谱估计)如:频谱减法、自适应噪声抵消法第5页,共26页。15.2语音特性、人耳感知特性及噪声特性-语音特性 n语音是一时变的、非平稳的随机过程,但由于一段时间内(1030 ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。n在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。n语音信号可以用统计分析特性来描述。语音的短时谱幅度的统计特性是时变的,只有当分析帧长趋于无穷大时,才能近似认为其具有高斯分布。高斯分布模型是根据中心极限定理得到的,将高斯模型应用于有限帧长只是一种近似的描述。在宽带
4、噪声污染的语音增强中,可将这种假设作为分析的前提。第6页,共26页。15.2语音特性、人耳感知特性及噪声特性-人耳感知特性 n语音感知问题涉及到生理学、心理学、声学和语音学诸多领域,人耳对背景噪声有很大的抑制作用,其中很多问题有待进一步研究。目前已有一些结论可用于语音增强:n 人耳对语音的感知主要是通过其幅度谱获得的,而对相位谱则不敏感。n 人耳对频率高低的感受近似与该频率的对数值成正比。n 人耳有掩蔽效应,即强信号对弱信号有抑制作用,能够将其掩盖。利用人耳的生理特点,提高语音信号的信噪比,使有用的语音信号大于噪声一定级别,就可以在语音与噪声共存的情况下感觉不到噪声的存在。n 共振峰对语音的感
5、知十分重要,特别是第二共振峰比第一共振峰更为重要,因此对语音信号进行一定程度的高通滤波不会对可懂度产生影响。n 人耳在两个人以上的说话环境中能够分辨出他所需要的声音。第7页,共26页。15.2语音特性、人耳感知特性及噪声特性-噪声特性 n周期性噪声的特点是有许多离散的窄谱峰,来源于发动机等周期性运转的机械。可以容易地通过检查功率谱发现并通过滤波或变换技术将其去掉。n冲激噪声表现为时域波形中突然出现的窄脉冲是放电的结果。根据带噪语音信号幅度的平均值确定阈值。当信号幅度超出这一阈值时,判别为冲激噪声,再对其进行衰减甚至完全消除。如果干扰脉冲之间不太靠近,还可以根据信号相邻样本数值简单地通过内插法将
6、其从时间函数中去掉。n宽带噪声通常可以假定为高斯噪声和白噪声。来源:风、呼吸噪声和一般随机噪声源。量化噪声通常作为白噪声来处理,也可以视为宽带噪声。消除的最成功的方法利用了某些非线性处理。目前的一些方法虽然降低了背景噪声,提高了信噪比,但并不提高语音的可懂度。第8页,共26页。15.2语音特性、人耳感知特性及噪声特性-滤波器法 n有三种常用的滤波器:固定滤波器自适应滤波器傅里叶变换滤波器。第9页,共26页。15.2语音特性、人耳感知特性及噪声特性-固定滤波器n固定滤波器用于滤除平稳干扰成分。n最常见的是50或60 Hz交流声。n滤除60 Hz成分很少采用高通滤波器,因为干扰是由60 Hz的奇次
7、谐波引起的,特别是37次谐波(交流哼声就是60 Hz交流声,它具有丰富的谐波,这种谐波一般是由于话筒输入插孔没有接地而造成的)。第10页,共26页。15.2语音特性、人耳感知特性及噪声特性-固定滤波器n(a)中,它由一个延时器和一个加法器构成。延迟时间为T,它等于滤波器凹口间的间隔f0的倒数。n(b)反馈使极点离开原点,并接近零点。当极点靠近零点时,除各零点附近以外,在单位圆各处都会引起部分对消。因此梳齿可以变得很窄,而梳齿之间的响应又是平坦的。第11页,共26页。15.2语音特性、人耳感知特性及噪声特性-自适应滤波 n自适应滤波能够自动辨认应该滤除的成分。n由线性预测器构成一个滤波器,其频率
8、响应近似等于输入信号的逆功率谱,这就可以实现自适应。n如果噪声是平稳或是缓变的,则在无语音期间便可以对噪声进行估计,并根据估计的结果调整波滤器。n采用这种方法的主要问题是,所得到的滤波器一般不是谱平衡的,这种不平衡使恢复的语音着色,并可能干扰线性预测声码器的工作。如果通过上述的部分使极点-零点对消而使凹口变窄,不会明显地改善系统的性能。某些实验表明,如果使LPC预测器的阶数比通常采用的阶数高得多,则可以去除干扰,改善语音。第12页,共26页。15.2语音特性、人耳感知特性及噪声特性-变换技术 n(a)所示。信号要经过DFT变换到频域,在频域进行处理,然后用IDFT来重建语音信号。n(b)所示为
展开阅读全文