书签 分享 收藏 举报 版权申诉 / 76
上传文档赚钱

类型语音信号处理第3章-语音信号分析方法课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3219343
  • 上传时间:2022-08-07
  • 格式:PPT
  • 页数:76
  • 大小:2.43MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《语音信号处理第3章-语音信号分析方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    语音 信号 处理 分析 方法 课件
    资源描述:

    1、第第 3 章语音信号分析方法章语音信号分析方法时域分析时域分析频域分析频域分析概述概述倒谱分析倒谱分析线性预测分析线性预测分析语音信号预处理语音信号预处理3.1概述概述贯穿于语音分析全过程的是贯穿于语音分析全过程的是“短时分析技术短时分析技术”。语音信号。语音信号从整体来看其特性及表征其本质特征的参数均是随时间而从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个非平稳态过程。但是,由于不同的变化的,所以它是一个非平稳态过程。但是,由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响语音是由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动相对于语音频率

    2、来说是非常缓慢应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢的。因此,的。因此,语音信号具有短时平稳性语音信号具有短时平稳性。任何语音信号的分析和处理必须建立在任何语音信号的分析和处理必须建立在“短时短时”基础上,基础上,将语音信号分为一段一段来分析其特征参数。通常,每一将语音信号分为一段一段来分析其特征参数。通常,每一段被称为一段被称为一“帧帧”,帧长一般取帧长一般取1030ms。此时,对于整。此时,对于整体的语音信号来讲,分析出得到的参数应该是由每一帧特体的语音信号来讲,分析出得到的参数应该是由每一帧特征参数组成的特征参数时间序列。征参数组成的特征参数时间序列。3.2语音信号预处理语音

    3、信号预处理3.2.1 3.2.1 分帧与加窗分帧与加窗分帧虽然可以采用连续分段的方法,但一般采用交叠分段的分帧虽然可以采用连续分段的方法,但一般采用交叠分段的方法。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的方法。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为比值一般取为01/2。分帧是用可移动的有限长度窗口进行。分帧是用可移动的有限长度窗口进行加权的方法来实现的,即用一定的窗函数来乘以语音信号。加权的方法来实现的,即用一定的窗函数来乘以语音信号。3.2.1 3.2.1 分帧与加窗分帧与加窗()()()nx mw m x nm加窗信号的表示形式:加窗信号的表示形式:常用加窗函数:

    4、常用加窗函数:1)矩形窗:)矩形窗:2)海宁窗:)海宁窗:3)汉明窗:)汉明窗:1,01()0,nNw nnelse0.5(1cos(2/(1)0n1()0nNNw nnelse0.540.46cos2/(1),01()0,nNnNw nnelse不同窗函数的形状差别比较大,因此对于短时分析参不同窗函数的形状差别比较大,因此对于短时分析参数的特性影响很大。选择合适的窗口可使短时参数更数的特性影响很大。选择合适的窗口可使短时参数更好地反映语音信号的特性变化。此外,窗函数的长度好地反映语音信号的特性变化。此外,窗函数的长度也是一个关键参数。也是一个关键参数。*窗口的形状窗口的形状虽然不同的短时分析

    5、方法以及求取不同的语音特虽然不同的短时分析方法以及求取不同的语音特征参数可能对窗函数的要求不尽一样,但一般来征参数可能对窗函数的要求不尽一样,但一般来讲,一个好的窗函数的标准是:讲,一个好的窗函数的标准是:在时域,由于是语音波形乘以窗函数,所以要在时域,由于是语音波形乘以窗函数,所以要减减小时间窗两端的坡度小时间窗两端的坡度,使窗口边缘两端不引起急,使窗口边缘两端不引起急剧变化而平滑过渡到零,从而以使截取出的语音剧变化而平滑过渡到零,从而以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;在频波形缓慢降为零,减小语音帧的截断效应;在频域,窗函数要有域,窗函数要有较宽的较宽的3dB带宽带宽以及

    6、以及较小的边带较小的边带最大值最大值。窗函数的频率响应:窗函数的频率响应:1)矩形窗:)矩形窗:2)海宁窗:)海宁窗:3)汉明窗:)汉明窗:1(1)/20sin(/2)()sin(/2)NjwnTjwT NRnNwTWweewT22()0.5()0.25()()11HanRRRWwWwWwWwNN22()0.54()0.23()()11HamRRRWwWwWwWwNN窗类型旁瓣峰值 主瓣宽度 最小阻带衰减矩形窗-134/N-21汉宁窗-318/N-44汉明窗-418/N-534/N8/N8/N性能对比性能对比*窗口的长度窗口的长度频率分辨率和时间分辨率是矛盾的,应该根据不同的需要频率分辨率和时

    7、间分辨率是矛盾的,应该根据不同的需要选择合适的窗口长度。选择合适的窗口长度。对于时域分析来讲,如果对于时域分析来讲,如果N很大,则它等效于很窄的低通很大,则它等效于很窄的低通滤波器,语音信号通过时,反映波形细节的高频部分被阻滤波器,语音信号通过时,反映波形细节的高频部分被阻碍,短时能量随时间变化很小,不能真实的反映语音信号碍,短时能量随时间变化很小,不能真实的反映语音信号的幅度变化;反之,的幅度变化;反之,N太小时,滤波器的通带变宽,短时太小时,滤波器的通带变宽,短时能量随时间有急剧的变化,不能得到平滑的能量函数。能量随时间有急剧的变化,不能得到平滑的能量函数。窗口长度的选择更重要地是要考虑语

    8、音信号的基音周期。窗口长度的选择更重要地是要考虑语音信号的基音周期。通常认为在一个语音帧内应包含通常认为在一个语音帧内应包含17个基音周期。个基音周期。1sfNT 3.2.2 3.2.2 消除趋势项和直流分量消除趋势项和直流分量产生原因:由于测试系统的某些原因在时间序列中会产生的产生原因:由于测试系统的某些原因在时间序列中会产生的一个线性的或者慢变的趋势误差,例如放大器随温度变化产一个线性的或者慢变的趋势误差,例如放大器随温度变化产生的零漂移,传声器低频性能的不稳定或传声器周围的环境生的零漂移,传声器低频性能的不稳定或传声器周围的环境干扰,总之使语音信号的零线偏离基线,甚至偏离基线的大干扰,总

    9、之使语音信号的零线偏离基线,甚至偏离基线的大小还会随时间变化。零线随时间偏离基线被称为信号的趋势小还会随时间变化。零线随时间偏离基线被称为信号的趋势项。项。消除方法:直流分量的消除比较简单,即减去语音信号的平消除方法:直流分量的消除比较简单,即减去语音信号的平均项即可。而对于线性趋势项或多项式趋势项,常用的消除均项即可。而对于线性趋势项或多项式趋势项,常用的消除趋势项的方法是用多项式最小二乘法。在趋势项的方法是用多项式最小二乘法。在MATLAB里自带里自带有消除线性趋势项的函数有消除线性趋势项的函数detrend。用一个多项式函数用一个多项式函数 表示语音信号中的趋势项:表示语音信号中的趋势项

    10、:20120(1,)mmjkmjjxaa ka ka ka kkn令函数令函数 与离散数据与离散数据 的误差二次方和为最小,即的误差二次方和为最小,即22110()()nnmjkkjkkkjExxa kx 通过解方程组求出通过解方程组求出m+1 个待定系数个待定系数 ai。在实际语音信号数据处理中,通常取在实际语音信号数据处理中,通常取m=13来对采样数据进来对采样数据进行多项式趋势项消除的处理。行多项式趋势项消除的处理。依次对依次对 ai求偏导,可得求偏导,可得 m+1 元线性方程组元线性方程组1010 i0,mnmnj iijkkjka kx k当当m=0 时求得的趋势项为常数,有时求得的

    11、趋势项为常数,有 解方程得解方程得由此可知,当由此可知,当 时的趋势项为信号采样数据的算术平均值,时的趋势项为信号采样数据的算术平均值,即是直流分量。消除常数趋势项的计算公式为即是直流分量。消除常数趋势项的计算公式为000110nnkkka kx k011nkkaxn0kkkkyxxxa当当 m=1时为线性趋势项,有时为线性趋势项,有 解方程组得解方程组得 消除线性趋势项的计算公式为消除线性趋势项的计算公式为 000111120111100nnnkkkknnnkkkka ka kx ka ka kx k1101112(21)6(1)126(1)(1)(1)nnkkkknnkkkknxx kan

    12、 nx knxan nn01()kkkkyxxxaa k采集语音信号时,交流隔离不好会将工频采集语音信号时,交流隔离不好会将工频50Hz的交的交流声混入到语音信号中,可采用高通滤波器滤除工流声混入到语音信号中,可采用高通滤波器滤除工频干扰;此外,由于基音的频率较低,通常位于频干扰;此外,由于基音的频率较低,通常位于60-450Hz之间。因此,在基音提取算法中,为了抗干之间。因此,在基音提取算法中,为了抗干扰,常设计低通滤波器来提取低频段信号。扰,常设计低通滤波器来提取低频段信号。常用的经典常用的经典IIR数字滤波器包含巴特沃斯滤波器、数字滤波器包含巴特沃斯滤波器、切比雪夫切比雪夫I型滤波器、切

    13、比雪夫型滤波器、切比雪夫II型滤波器和椭圆滤型滤波器和椭圆滤波器四类。波器四类。3.2.3 3.2.3 数字滤波器数字滤波器各种理想滤波器的幅频特性各种理想滤波器的幅频特性 理想滤波器对应的时域响应为理想滤波器对应的时域响应为非因果非因果的,因而实际的滤波器的,因而实际的滤波器频率特性是用一个具有因果冲激响应的系统函数对理想滤波器频频率特性是用一个具有因果冲激响应的系统函数对理想滤波器频率特性的逼近。率特性的逼近。1|()|1jpH e|()|jsH e|ps过渡带过渡带|p通带通带p通带截止频率通带截止频率p通带容限通带容限|s阻带阻带s阻带截止频率阻带截止频率s阻带容限阻带容限低通滤波器幅

    14、频特性低通滤波器幅频特性IIR滤波器结构滤波器结构lIIR滤波器的系统函数为1;1)()()(01111000azazazbzbbzazbzAzBzHNNMMNnnnMnnn如果如果aN=0,则,则IIR滤波器的阶数为滤波器的阶数为N。IIR滤波器的差分方程表示为:滤波器的差分方程表示为:MmNmmmmnyamnxbny01)()()(设计经典数字滤波器的步骤:设计经典数字滤波器的步骤:(1)将设计指标归一化处理,即通带截止频率)将设计指标归一化处理,即通带截止频率Wp和阻带截止频率和阻带截止频率Ws。(2)根据归一化频率,确定最小阶数)根据归一化频率,确定最小阶数N 和频率参数和频率参数Wn

    15、。可供选用的阶数选择函数有。可供选用的阶数选择函数有:buttord,cheb1ord,cheb2ord,ellipord 等。等。(3)运用最小阶数)运用最小阶数N 设计模拟低通滤波器原型,用设计模拟低通滤波器原型,用到的函数有:到的函数有:butter,chebyl,cheby2,ellip。(4)用)用freqz(b,a,N,fs)函数验证设计结果。函数验证设计结果。(5)用)用filter(b,a,x)函数实现滤波功能。函数实现滤波功能。直接设计数字滤波器的直接设计数字滤波器的MATLAB函数:函数:N,wn=buttord(wp,ws,Rp,Rs)%数字频率采用标数字频率采用标准化频

    16、率,取值范围为准化频率,取值范围为01之间,标准化频率之间,标准化频率1对对应的数字频率为应的数字频率为,对应的模拟频率为采样频率,对应的模拟频率为采样频率的一半。设计带通滤波器时,的一半。设计带通滤波器时,wp=wp1,wp2;ws=ws1,ws2b,a=butter(N,wn,ftype)%N为滤波器的阶数,为滤波器的阶数,wn为滤波器的截止频率(为滤波器的截止频率(01),),“ftype”为滤为滤波器的类型:波器的类型:high为高通,为高通,stop为带阻,为带阻,截止频率为截止频率为wn=w1,w2;缺省时为低通和带通滤缺省时为低通和带通滤波器波器设计实例:设计巴特沃斯低通滤波器,

    17、采样频率设计实例:设计巴特沃斯低通滤波器,采样频率Fs=22050Hz,通带截止频率通带截止频率3400Hz,阻带截止频率,阻带截止频率5000Hz,通带和阻带区的,通带和阻带区的波纹系数分为为波纹系数分为为2dB和和20dB。%设计指标设计指标Fs=22050;Fp1=3400;Fs1=5000;Rp=3;Rs=20;Nn=128;wp1=2*Fp1/Fs;ws1=2*Fs1/Fs;%求归一化频率求归一化频率%确定确定butterworth 的最小阶数的最小阶数N 和频率参数和频率参数WnN,Wn=buttord(wp1,ws1,Rp,Rs);b,a=butter(N,Wn);%确定传递函数

    18、的分子、分母系数确定传递函数的分子、分母系数 h,f=freqz(b,a,Nn,Fs);%生成频率响应参数生成频率响应参数 plot(f,20*log(abs(h)%画幅频响应图画幅频响应图020004000600080001000012000-600-500-400-300-200-1000巴特沃斯低通滤波器幅频曲线频率/Hz幅度/dB3.2.4 3.2.4 预加重与去加重预加重与去加重对于语言和音乐来说,其功率谱随频率的增加而减小,其对于语言和音乐来说,其功率谱随频率的增加而减小,其大部分能量集中在低频范围内,这就造成语音信号高频端大部分能量集中在低频范围内,这就造成语音信号高频端的信噪比

    19、可能降到不能容许的程度。此外,由于语音信号的信噪比可能降到不能容许的程度。此外,由于语音信号中较高频率分量的能量小,很少有足以产生最大频偏的幅中较高频率分量的能量小,很少有足以产生最大频偏的幅度,因此产生最大频偏的信号幅度多数是由信号的低频分度,因此产生最大频偏的信号幅度多数是由信号的低频分量引起。而调频系统的传输带宽是由需要传送的消息信号量引起。而调频系统的传输带宽是由需要传送的消息信号的最高有效频率和最大频偏决定的,所以调频信号并没有的最高有效频率和最大频偏决定的,所以调频信号并没有充分占用给予它的带宽。但是,接收端输入的噪声频谱却充分占用给予它的带宽。但是,接收端输入的噪声频谱却占据了整

    20、个调频带宽,即鉴频器输出端的噪声功率谱在较占据了整个调频带宽,即鉴频器输出端的噪声功率谱在较高频率上已被加重了。高频率上已被加重了。为了抵消这种不希望有的现象,在调频系统中普遍采用一为了抵消这种不希望有的现象,在调频系统中普遍采用一种叫做预加重和去加重措施。种叫做预加重和去加重措施。预加重的中心思想是利用信号特性和噪声特性的差别来有预加重的中心思想是利用信号特性和噪声特性的差别来有效地对信号进行处理。在噪声引入之前采用预加重网络,效地对信号进行处理。在噪声引入之前采用预加重网络,人为地加重输入调制信号的高频分量。然后在接收机鉴频人为地加重输入调制信号的高频分量。然后在接收机鉴频器的输出端,再进

    21、行相反的处理,即采用去加重网络把高器的输出端,再进行相反的处理,即采用去加重网络把高频分量去加重,恢复原来的信号功率分布。在去加重过程频分量去加重,恢复原来的信号功率分布。在去加重过程中,同时也减小了噪声的高频分量,但是预加重对噪声并中,同时也减小了噪声的高频分量,但是预加重对噪声并没有影响,因此有效地提高了输出信噪比。没有影响,因此有效地提高了输出信噪比。常用所谓常用所谓“预加重技术预加重技术”是在取样之后,插入一个一阶的高是在取样之后,插入一个一阶的高通滤波器。常用的预加重因子为通滤波器。常用的预加重因子为:11(1)11(0)REPzzR 对于浊音来说,通常对于浊音来说,通常 P=1;而

    22、对于清音,则该值可取得很小。;而对于清音,则该值可取得很小。在语音播放时再进行在语音播放时再进行“去加重去加重”处理,即预加重的反处理,对处理,即预加重的反处理,对应的去加重因子为应的去加重因子为1/E。3.3时域分析时域分析时域分析是最早使用,也是应用最广泛的一种分析时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。方法,这种方法直接利用语音信号的时域波形。特点包括:特点包括:1)语音信号表达比较)语音信号表达比较直观直观、物理意义明物理意义明确确;2)实现简单、)实现简单、运算量少运算量少;3)可得到语音的一)可得到语音的一些重要的参数;些重要的参数;4

    23、)可使用示波器等通用设备进行观)可使用示波器等通用设备进行观测,使用简单。测,使用简单。语音信号的时域参数有语音信号的时域参数有短时能量、短时过零率、短短时能量、短时过零率、短时自相关函数和短时平均幅度差函数时自相关函数和短时平均幅度差函数等,计算这些等,计算这些参数时,常用的窗函数有矩形窗和汉明窗等。参数时,常用的窗函数有矩形窗和汉明窗等。3.3.1 3.3.1 短时能量及短时平均幅度短时能量及短时平均幅度短时能量短时能量En的表达式:的表达式:短时平均幅度函数短时平均幅度函数Mn 的表达式:的表达式:10|()|NnnmMx mN120()NnnmExm主要用途有:主要用途有:1)可以区分

    24、浊音段与清音段,因为浊音时)可以区分浊音段与清音段,因为浊音时 值值比清音时大的多;比清音时大的多;2)可以用来区分声母与韵母的分界,无)可以用来区分声母与韵母的分界,无声与有声的分界,连字(指字之间无间隙)的分界等;声与有声的分界,连字(指字之间无间隙)的分界等;3)作为一种超音段信息,用于语音识别中。作为一种超音段信息,用于语音识别中。3.3.2 3.3.2 短时过零率短时过零率短时过零率表示一帧语音中信号波形穿过横轴短时过零率表示一帧语音中信号波形穿过横轴(零电平)的次数。(零电平)的次数。实际上,由于发生过零时,离散信号相邻的取样值实际上,由于发生过零时,离散信号相邻的取样值符号改变,

    25、那么相邻值的乘积一定为负数,所以通符号改变,那么相邻值的乘积一定为负数,所以通过统计小于零的个数,获得短时平均过零率。过统计小于零的个数,获得短时平均过零率。101|sgn()sgn(1)|2NnnnmZx mx m注意:注意:50Hz的工频干扰或者的工频干扰或者A/D变换器的工作点偏变换器的工作点偏移移(等效于输入信号有直流偏移等效于输入信号有直流偏移),会使计算的过零,会使计算的过零率参数不准确。率参数不准确。3.3.3 3.3.3 短时自相关短时自相关相关分析是一种常用的时域波形分析方法,并有自相关和相关分析是一种常用的时域波形分析方法,并有自相关和互相关之分。在语音信号分析中,可用自相

    26、关函数求出浊互相关之分。在语音信号分析中,可用自相关函数求出浊音的基音周期,也可用于语音信号的线性预测分析。音的基音周期,也可用于语音信号的线性预测分析。10()()()NknnnmR kx m x mk 短时自相关函数的性质:短时自相关函数的性质:(1)如果)如果 信号是周期的,则自相关函数是同周期的周期函信号是周期的,则自相关函数是同周期的周期函数。数。(2)自相关函数是偶函数。自相关函数是偶函数。(3)自相关函数具有最大值)自相关函数具有最大值Rn(0),并且,并且 等于确定性信号等于确定性信号序列的能量或随机性序列的平均功率。序列的能量或随机性序列的平均功率。3.3.4 3.3.4 短

    27、时平均幅度差短时平均幅度差短时平均幅度差函数的定义:短时平均幅度差函数的定义:显然,计算短时平均幅度差函数显然,计算短时平均幅度差函数只需只需加、减法和取加、减法和取绝对值的运算,与自相关函数的加法与乘法相比,绝对值的运算,与自相关函数的加法与乘法相比,其运算量其运算量大大减少大大减少,尤其在用硬件实现语音信号分,尤其在用硬件实现语音信号分析时有很大好处。为此,短时平均幅度差已被用在析时有很大好处。为此,短时平均幅度差已被用在许多许多实时实时语音处理系统中。语音处理系统中。11()(1)()N knnnmF kx mkx m 3.4频域分析频域分析3.4.1 3.4.1 短时傅里叶变换短时傅里

    28、叶变换语音信号的频域分析就是分析语音信号的频域特征。从广义语音信号的频域分析就是分析语音信号的频域特征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等。其中,最常用的频域分析方法是倒频谱、频谱包络分析等。其中,最常用的频域分析方法是傅里叶变换法。傅里叶变换法。短时傅里叶变换是和傅里叶变换相关的一种数学变换,用以短时傅里叶变换是和傅里叶变换相关的一种数学变换,用以确定时变信号其局部区域正弦波的频率与确定时变信号其局部区域正弦波的频率与相位相位。其基本思想。其基本思想是:选择一个时频局部化的是:选择一个时频局部化

    29、的窗函数窗函数,假定该分析窗函数在一,假定该分析窗函数在一个短时间间隔内是平稳(伪平稳)的,使语音信号与该窗函个短时间间隔内是平稳(伪平稳)的,使语音信号与该窗函数的乘积在不同的有限时间宽度内是数的乘积在不同的有限时间宽度内是平稳信号平稳信号,从而计算出,从而计算出各个不同时刻的各个不同时刻的功率谱功率谱。3.4.1 3.4.1 短时傅里叶变换短时傅里叶变换短时傅里叶变换的定义:短时傅里叶变换的定义:根据卷积定理,有:根据卷积定理,有:10()()()NjwjwmnmXex m w nm e()()()jwjwjwnjwnXeX eeW e短时傅里叶变换指的是分帧信号的离散时域傅里叶变换短时傅

    30、里叶变换指的是分帧信号的离散时域傅里叶变换 和和窗函数的离散时域傅里叶变换窗函数的离散时域傅里叶变换 的的周期卷积。的的周期卷积。3.4.2 3.4.2 功率谱估计功率谱估计在语音信号数字处理中,功率谱具有重要意义,可用来滤在语音信号数字处理中,功率谱具有重要意义,可用来滤波,信号识别(分析信号频率),信号分离,系统辨识等。波,信号识别(分析信号频率),信号分离,系统辨识等。其中,对自相关序列求傅里叶变换的估计方法,称为周期其中,对自相关序列求傅里叶变换的估计方法,称为周期图法,即图法,即由由11()()NjwjwkpernkNPeR k e*11()()()()*()nnnnnmR kx m

    31、k x mx kxkNN3.5倒谱分析倒谱分析语音信号的倒谱分析就是求取语音倒谱特征参数的语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态处理来实现。同态信号处理过程,它可以通过同态处理来实现。同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理,即解卷。对语音信号进行解卷,关系的分离处理,即解卷。对语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语开来,从而求得声道共振特征和基音周期,用于语音编码、合成、识别等。解卷

    32、并求取倒谱特征参数音编码、合成、识别等。解卷并求取倒谱特征参数的方法主要有同态信号处理和线性预测两类。的方法主要有同态信号处理和线性预测两类。3.5.1 3.5.1 同态信号处理的基本原理同态信号处理的基本原理日常生活中的许多信号,并不是加性信号而是乘日常生活中的许多信号,并不是加性信号而是乘积性信号或卷积性信号,如语音信号、图像信号、积性信号或卷积性信号,如语音信号、图像信号、通信中的衰落信号、调制信号等。这些信号要用通信中的衰落信号、调制信号等。这些信号要用非线性系统来处理,而同态信号处理就是将非线非线性系统来处理,而同态信号处理就是将非线性问题转化为线性问题的处理方法。按被处理的性问题转

    33、化为线性问题的处理方法。按被处理的信号分类,同态信号处理大体分为乘积同态处理信号分类,同态信号处理大体分为乘积同态处理和卷积同态处理两种。和卷积同态处理两种。一般同态系统构成:一般同态系统构成:3.5.1 3.5.1 同态信号处理的基本原理同态信号处理的基本原理系统包括两个特征子系统系统包括两个特征子系统D*和和 D*-1,一个线性子系统,一个线性子系统L。图中,符号。图中,符号、+和和分别表示卷积、加法和乘法运分别表示卷积、加法和乘法运算。算。第一个特征子系统第一个特征子系统D*,完成将卷积性信号转化为加性信,完成将卷积性信号转化为加性信号的运算:号的运算:121212111212(1)()

    34、()()()(2)ln()ln()ln()()()()(3)()()()()()()Z x nX zXzXzX zXzXzXzXzX zZX zZXzXzx nx nx n3.5.1 3.5.1 同态信号处理的基本原理同态信号处理的基本原理第二个子系统是一个普通线性系统,满足线性叠加原理,第二个子系统是一个普通线性系统,满足线性叠加原理,用于对加性信号进行线性变换。用于对加性信号进行线性变换。第三个子系统是逆特征系统第三个子系统是逆特征系统D*-1,将加性信号恢复为卷,将加性信号恢复为卷积性信号:积性信号:121211212(1)()()()()(2)exp()()()()(3)()()()(

    35、)()Z y nY zY zYzY zY zY zYzy nZY zYzy ny n声门激励信号和声道冲激响应分离效果图声门激励信号和声道冲激响应分离效果图3.5.2 3.5.2 复倒谱与倒谱复倒谱与倒谱复倒谱的定义为:复倒谱的定义为:1()ln ()x nZZ x n在绝大多数数字信号处理中,在绝大多数数字信号处理中,由于由于Z变换的收敛域均包含变换的收敛域均包含单位圆,可得单位圆,可得1()ln()jx nFX e设设arg()()()jjjjX eX eX ee可得可得()ln()arg()jjjX eX ejX e如果只考虑实部,得倒谱表示如果只考虑实部,得倒谱表示1()ln()jc

    36、nFX e3.5.3 3.5.3 美尔倒谱系数美尔倒谱系数人耳所听到的声音的高低与声音的频率并不成人耳所听到的声音的高低与声音的频率并不成线性正比关系,而美尔频率尺度则更符合人耳的线性正比关系,而美尔频率尺度则更符合人耳的听觉特性,大体上对应于实际频率的对数分布关听觉特性,大体上对应于实际频率的对数分布关系。系。人耳基底膜可分为许多小的部分,每一部分对人耳基底膜可分为许多小的部分,每一部分对应于一个频率群,称为临界频带,其带宽随着频应于一个频率群,称为临界频带,其带宽随着频率的变化而变化,并与美尔频率的增长一致,在率的变化而变化,并与美尔频率的增长一致,在1000Hz以下,大致呈线性分布,带宽

    37、为以下,大致呈线性分布,带宽为100Hz左左右;在右;在1000Hz以上呈对数增长。以上呈对数增长。类似于临界频带的划分,美尔滤波器组具有三角形滤波类似于临界频带的划分,美尔滤波器组具有三角形滤波特性,其中心频率为特性,其中心频率为(m),在美尔频率范围内,这些滤,在美尔频率范围内,这些滤波器是等带宽的。每个带通滤波器的传递函数为:波器是等带宽的。每个带通滤波器的传递函数为:0(1)(1)(1)()()(1)()(1)()(1)(1)()0(1)mkf mkf mf mkf mf mf mHkf mkf mkf mf mf mkf m 美尔滤波器的中心频率美尔滤波器的中心频率(m)定义为定义为

    38、1()()()()1MelhMellMelMellsFfFfNf mFFfmfM式中式中11125()700(1)bMelFbe在在MATLAB中,中,melbankm函数可用于计算美尔滤波器组。函数可用于计算美尔滤波器组。1)预处理,包括预加重、分帧、加窗函数。)预处理,包括预加重、分帧、加窗函数。2)快速傅立叶变换,对每一帧信号进行)快速傅立叶变换,对每一帧信号进行FFT变换。变换。(,)()iX i kFFT x m3)计算每一帧)计算每一帧FFT后的数据的谱线能量后的数据的谱线能量2(,)()iE i kX k4)计算通过美尔滤波器的能量)计算通过美尔滤波器的能量10()(,)(),N

    39、imkS mE i k Hk5)计算)计算DCT倒谱。倒谱。注意:注意:1)美尔滤波器组可选择除三角形滤波器外的滤波器组,)美尔滤波器组可选择除三角形滤波器外的滤波器组,如正弦形的滤波组等;如正弦形的滤波组等;2)FFT的点数选取过大,则运算复杂度增大,使系统响的点数选取过大,则运算复杂度增大,使系统响应时间变慢,不能满足系统的实时性;如果应时间变慢,不能满足系统的实时性;如果FFT的点数的点数选取太小,则可能造成频率分辨率过低,提取的参数的选取太小,则可能造成频率分辨率过低,提取的参数的误差过大。一般要根据系统的具体情况选择误差过大。一般要根据系统的具体情况选择FFT的点数。的点数。102(

    40、21)(,)log(,)cos2Mmnmmfcc i nS i mMM*离散余弦变换离散余弦变换(DCT(DCT离散余弦变换具有信号谱分量丰富、能量集中,且不需离散余弦变换具有信号谱分量丰富、能量集中,且不需要对语音相位进行估算等优点,能在较低的运算复杂度要对语音相位进行估算等优点,能在较低的运算复杂度下取得较好的语音增强效果。下取得较好的语音增强效果。式中式中a(k)的定义为的定义为 1010(21)()cos2(21)()cos2NnNknkX ka kx nNnkx na k X kN 1/,k=02/,k1,N-1 Na kN3.6线性预测线性预测分析分析1947年维纳首次提出,是一种

    41、很重要的技术,几年维纳首次提出,是一种很重要的技术,几乎普遍地应用于语音信号处理的各个方面。乎普遍地应用于语音信号处理的各个方面。基本思想是:由于语音样点之间存在相关性,所基本思想是:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。定唯一的

    42、一组预测系数。预测系数就反映了语音信号的特性,可作为语音预测系数就反映了语音信号的特性,可作为语音特征参数用于语音识别、语音合成等。特征参数用于语音识别、语音合成等。3.6.1 3.6.1 基本原理基本原理线性预测分析的基本思想是:用过去线性预测分析的基本思想是:用过去 p个样点值来预测现个样点值来预测现在或未来的样点值。在或未来的样点值。1()()piis na s ni预测误差为:预测误差为:1()()()()()piins ns ns na s ni通过在某个准则下使预测误差通过在某个准则下使预测误差 达到最小值的方法来决定达到最小值的方法来决定唯一的一组线性预测系数唯一的一组线性预测系

    43、数 ai。3.6.1 3.6.1 基本原理基本原理系统的输入系统的输入e(n)是语音激励,是语音激励,s(n)是输出语音,则系统对是输出语音,则系统对应的输入与输出之间的时域关系为应的输入与输出之间的时域关系为10()()()pqilils na s niGbe nl对应的系统模型为:对应的系统模型为:111()1qlllpiiib zH zGa z3.6.1 3.6.1 基本原理基本原理系统模型分为三类:系统模型分为三类:1)ARMA模型:同时含有极点和零点。模型:同时含有极点和零点。2)AR模型:只含有极点。模型:只含有极点。3)MA模型:只含有零点。模型:只含有零点。1()1piiiGH

    44、 za z1()1qlllH zb z 3.6.1 3.6.1 基本原理基本原理实际上语音信号处理中最常用的模型是全极点模型:实际上语音信号处理中最常用的模型是全极点模型:1)如果不考虑鼻音和摩擦音,那么语音的声道传递函数)如果不考虑鼻音和摩擦音,那么语音的声道传递函数就是一个全极点模型;对于鼻音和摩擦音,声学理论表就是一个全极点模型;对于鼻音和摩擦音,声学理论表明其声道传输函数既有极点又有零点,但这时如果模型明其声道传输函数既有极点又有零点,但这时如果模型的阶数的阶数 足够高,可以用全极点模型来近似表示极零点模足够高,可以用全极点模型来近似表示极零点模型,因为一个零点可以用许多极点来近似。型

    45、,因为一个零点可以用许多极点来近似。2)可以用线性预测分析的方法估计全极点模型参数,因)可以用线性预测分析的方法估计全极点模型参数,因为对全极点模型作参数估计是对线性方程的求解过程,为对全极点模型作参数估计是对线性方程的求解过程,相对容易计算。当模型中含有有限个零点时,求解过程相对容易计算。当模型中含有有限个零点时,求解过程变为解非线性方程组,实现起来非常困难。变为解非线性方程组,实现起来非常困难。3)对于某些系统来说,输入信号是未知的。但是,由于)对于某些系统来说,输入信号是未知的。但是,由于语音样点间有相关性,可以用过去的样点值预测未来样语音样点间有相关性,可以用过去的样点值预测未来样点值

    46、。点值。*线性预测方程的建立线性预测方程的建立由全极点模型可知预测误差为:由全极点模型可知预测误差为:1()()()()piins na s niGe n令某一帧内的短时平均预测误差为:令某一帧内的短时平均预测误差为:221()()()pinniEns na s ni为使为使E最小,对最小,对aj 求偏导,并变换形式可得求偏导,并变换形式可得1()()()()(1)pinins n s njas ni s njjp*线性预测方程的建立线性预测方程的建立求解该方程组可得各个预测器系数,可得求解该方程组可得各个预测器系数,可得为求解最佳预测器系数,必须首先求出为求解最佳预测器系数,必须首先求出 ,

    47、其计算及,其计算及方程组的求解都是十分复杂的,因此必须选择适当的算法。方程组的求解都是十分复杂的,因此必须选择适当的算法。1(0,0)(0,)piiEai(,)()()nj is ni s nj(,)j i定义定义1(,0)(,)(1)piijaj ijp则则3.6.2 3.6.2 线性预测方程组的求解线性预测方程组的求解虽然可以用各种各样的方法来解包含虽然可以用各种各样的方法来解包含p 个未知数的个未知数的 p个线个线性方程,但是系数矩阵的特殊性质使得解方程的效率比性方程,但是系数矩阵的特殊性质使得解方程的效率比普通解法的效率要高得多。在线性预测分析中,对于线普通解法的效率要高得多。在线性预

    48、测分析中,对于线性预测参数性预测参数 ai的求解,有自相关法和协相关法两种经典的求解,有自相关法和协相关法两种经典解法,另外还有效率较高的格型法等。解法,另外还有效率较高的格型法等。利用线性预测分析可利用线性预测分析可以建立语音信号模型,以建立语音信号模型,可将辐射、声道以及可将辐射、声道以及声门激励的全部效应声门激励的全部效应简化为一个时变的数简化为一个时变的数字滤波器。字滤波器。自相关法自相关法自相关法是经典解法之一,其原理是在整个时间范围内自相关法是经典解法之一,其原理是在整个时间范围内使误差最小。使误差最小。自相关法自相关法信号的加窗自相关函数定义为信号的加窗自相关函数定义为则则10(

    49、)()()1Nnr js n s njjp(,)()j ir ji由此方程组可改为由此方程组可改为1(|)()1piia rjir jjp则最小均方误差改写为则最小均方误差改写为1(0)()piiErar i123(0)(1)(2)(1)(1)(1)(0)(1)(2)(2)(2)(1)(0)(3)(3)(1)(2)(3)(0)()parrrr prarrrr prarrrr prar pr pr prr p自相关法自相关法展开方程组为展开方程组为:式左边为相关函数的矩阵,以对角线为对称,其主对角线以式左边为相关函数的矩阵,以对角线为对称,其主对角线以及和主对角线平行的任何一条斜线上所有的元素相

    50、等。这种及和主对角线平行的任何一条斜线上所有的元素相等。这种矩阵称为托普利兹矩阵,而这种方程称为矩阵称为托普利兹矩阵,而这种方程称为Yule-Walker方程。方程。对于该矩阵方程无需像求解一般矩阵方程那样进行大量的计对于该矩阵方程无需像求解一般矩阵方程那样进行大量的计算,利用托普利兹矩阵的性质可以获得一种高效方法。算,利用托普利兹矩阵的性质可以获得一种高效方法。自相关法自相关法矩阵方程组可以采用递归方法求解,最常用的是莱文逊矩阵方程组可以采用递归方法求解,最常用的是莱文逊-杜杜宾算法。宾算法。MATLAB工具箱中的工具箱中的lpc函数用莱文逊函数用莱文逊-杜宾的自相杜宾的自相关方法计算预测系

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:语音信号处理第3章-语音信号分析方法课件.ppt
    链接地址:https://www.163wenku.com/p-3219343.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库