语音信号处理ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语音信号处理ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 ppt 课件
- 资源描述:
-
1、5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)1第三章第三章 语音信号的短时时域分析语音信号的短时时域分析 3.1 概述概述13.2 语音信号的预处理语音信号的预处理3.3 短时平均能量短时平均能量 33.4 短时平均幅度函数短时平均幅度函数 43.5 短时平均过零率短时平均过零率 5 3.6 短时自相关分析短时自相关分析 62 3.7 基于能量和过零率的语音端点检测基于能量和过零率的语音端点检测7 3.8 基音周期估值基音周期估值 85/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)23.1 概述概述 语音信号是一种非平稳的时变
2、信号,它携带语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含和语音增强等语音处理中都需要提取语音中包含的各种信息。的各种信息。 语音处理的目的:对语音信号进行分析,提语音处理的目的:对语音信号进行分析,提取特征参数,用于后续处理;加工语音信号。取特征参数,用于后续处理;加工语音信号。 总之,语音信号分析的目的就在于方便有效总之,语音信号分析的目的就在于方便有效的提取并表示语音信号所携带的信息。的提取并表示语音信号所携带的信息。 5/11/2022数字语音处理及MATLAB仿真 张
3、雪英编著(李红莲修改并主讲)3 根据所分析的参数类型,语音信号分析可以根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,提取的特直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量和平均幅度、短时征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差平均过零率、短时自相关函数和短时平均幅度差函数等。函数等。5/11/2022数字语音处理及MATLAB仿真 张雪英
4、编著(李红莲修改并主讲)43.2 语音信号的预处理语音信号的预处理 在对语音信号进行数字处理之前,首先要将在对语音信号进行数字处理之前,首先要将模拟语音信号模拟语音信号s(t) 离散化为离散化为s(n). 实际中获得数字实际中获得数字语音的途径一般有两种,正式的和非正式的。语音的途径一般有两种,正式的和非正式的。 正式的是指大公司或语音研究机构发布的被正式的是指大公司或语音研究机构发布的被大家认可的语音数据库,非正式的则是研究者个大家认可的语音数据库,非正式的则是研究者个人用录音软件或硬件电路加麦克风随时随地录制人用录音软件或硬件电路加麦克风随时随地录制的一些发音或语句。的一些发音或语句。5/
5、11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)5 语音信号的频率范围通常是语音信号的频率范围通常是3003400Hz,一,一般情况下取采样率为般情况下取采样率为8kHz即可。本书的数字语音即可。本书的数字语音处理对象为语音数据文件,是已经数字化了的语处理对象为语音数据文件,是已经数字化了的语音。音。 有了语音数据文件后,对语音的预处理包括:有了语音数据文件后,对语音的预处理包括:预加重、加窗分帧等。预加重、加窗分帧等。5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)63.2.1 语音信号的预加重处理语音信号的预加重处理 预加重目的:
6、为了对语音的高频部分进行加重,预加重目的:为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。去除口唇辐射的影响,增加语音的高频分辨率。可通过一阶可通过一阶FIR高通数字滤波器来实现:高通数字滤波器来实现:1( )1H zz 设设n时刻的语音采样值为时刻的语音采样值为x(n) ,经过预加重处理后经过预加重处理后的结果为的结果为 ( )( )(1)y nx nx n5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)7高通滤波器的幅频特性和相频特性如下高通滤波器的幅频特性和相频特性如下 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(
7、李红莲修改并主讲)8预加重前和预加重后的一段语音信号时域波形预加重前和预加重后的一段语音信号时域波形 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)9 预加重前和预加重后的一段语音信号频谱预加重前和预加重后的一段语音信号频谱 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)103.2.2 语音信号的加窗处理语音信号的加窗处理 由于发音器官的惯性运动,可以认为在一小由于发音器官的惯性运动,可以认为在一小段时间里(一般为段时间里(一般为10ms30ms)语音信号近似不)语音信号近似不变,即语音信号具有短时平稳性。这样,可以把变,即语
8、音信号具有短时平稳性。这样,可以把语音信号分为一些短段(称为分析帧)来进行处语音信号分为一些短段(称为分析帧)来进行处理。理。 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)11 语音信号的分帧实现方法:语音信号的分帧实现方法: 采用可移动的有限长度窗口进行加权的方法采用可移动的有限长度窗口进行加权的方法来实现的。一般每秒的帧数约为来实现的。一般每秒的帧数约为33100帧。帧。 分帧一般采用交叠分段的方法,这是为了使分帧一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移
9、,帧移与帧长的比值后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为一般取为01/2。 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)12图图3.3给出了帧移与帧长示意图。给出了帧移与帧长示意图。 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)13加窗常用的两种方法:加窗常用的两种方法:矩形窗,窗函数如下:矩形窗,窗函数如下:其它 010 1)(Nnnw汉明汉明(Hamming)窗,窗函数如下窗,窗函数如下 0.540.46 cos 2 /1 0( ) 0 nNnNw n其它,5/11/2022数字语音处理及MATLAB仿真
10、张雪英编著(李红莲修改并主讲)14矩形窗及其频谱如下矩形窗及其频谱如下5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)15汉明窗及其频谱如下汉明窗及其频谱如下思考:思考:两种窗效果有何异同?两种窗效果有何异同?5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)165/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)17加窗方法示意图:加窗方法示意图: 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)18窗长的选择窗长的选择 一般选取一般选取100200。原因如下:。原因如下
11、: 当窗较宽时,平滑作用大,能量变化不大,当窗较宽时,平滑作用大,能量变化不大,故反映不出能量的变化。故反映不出能量的变化。 当窗较窄时,没有平滑作用,反映了能量的当窗较窄时,没有平滑作用,反映了能量的快变细节,而看不出包络的变化。快变细节,而看不出包络的变化。 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)19 语音信号的分帧处理,实际上就是对各帧进行语音信号的分帧处理,实际上就是对各帧进行某种变换或运算。设这种变换或运算用某种变换或运算。设这种变换或运算用T 表示,表示,x(n)为输入语音信号,为输入语音信号,w(n)为窗序列,为窗序列,h(n)是与是与w
12、(n)有关的滤波器,则各帧经处理后的输出可以表示为:有关的滤波器,则各帧经处理后的输出可以表示为: ( ) ()nmQT x m h nm5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)20几种常见的短时处理方法是:几种常见的短时处理方法是:22 ( )( )( )( )T x mxmh nw n,nQ1.对应于能量;对应于能量; ( ) sgn ( ) sgn (1)( )( )T xmxmxmhnwn,2.,nQ对应于平均过零率;对应于平均过零率; ( )( ) () T xmxmxm kh nw n w n k,3.nQ对应于对应于自相关函数自相关函数 ;
13、5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)213.3 短短时平均能量时平均能量 1短时平均能量定义短时平均能量定义定义定义n时刻某语音信号的短时平均能量时刻某语音信号的短时平均能量En为:为: )()( )()()1(22nNnmmnmnwmxmnwmxE当窗函数为矩形窗时,有当窗函数为矩形窗时,有 )() 1(2nNnmnmxE5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)22若令若令 则则短时平均能量短时平均能量可以写成:可以写成: )()(2nwnh )()()()(22nhnxmnhmxEmn x ( n ) x
14、2 ( n ) E n h ( n ) ( . ) 2 图 3.7 语音信号的短时平均能量实现方框图 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)232. En特点:特点:En反映语音信号的幅度或能量随时间缓反映语音信号的幅度或能量随时间缓慢变化的规律慢变化的规律 。3. 窗的长短对于能否由短时能量反映语音信号的幅窗的长短对于能否由短时能量反映语音信号的幅度变化,起着决定性影响。度变化,起着决定性影响。 如果窗选得很长,如果窗选得很长,En不能反映语音信号幅度变化不能反映语音信号幅度变化。 窗选得太窄,窗选得太窄,En将不够平滑。将不够平滑。 通常,当取样频
15、率为通常,当取样频率为10kHz时,选择窗宽度时,选择窗宽度N=100200是比较合适的。是比较合适的。5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)24不同矩形窗长不同矩形窗长N时的短时能量函数时的短时能量函数 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)25 短时平均能量的主要用途如下:短时平均能量的主要用途如下: 1)可以作为区分清音和浊音的特征参数。)可以作为区分清音和浊音的特征参数。 2)在信噪比较高的情况下,短时能量还可以作为)在信噪比较高的情况下,短时能量还可以作为区分有声和无声的依据。区分有声和无声的依据。
16、3)可以作为辅助的特征参数用于语音识别中。)可以作为辅助的特征参数用于语音识别中。5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)26MATLAB的具体实现如下的具体实现如下 :1、用、用Cooledit读入语音读入语音“我到北京去我到北京去”。2、将读入的语音文件、将读入的语音文件wav保存为保存为txt文件,设置采样文件,设置采样率为率为8kHz,16位,单声道。位,单声道。3、把保存的文件、把保存的文件zqq.txt读入读入Matlab。fid=fopen(zqq.txt,rt); x=fscanf(fid,%f);fclose(fid);4、对采集到的语
17、音样点值进行分帧。、对采集到的语音样点值进行分帧。5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)273.4 短时平均短时平均幅度函数幅度函数 为了克服短时能量函数计算为了克服短时能量函数计算x2 ( m ) 的缺点,的缺点,定义了短时平均幅度函数定义了短时平均幅度函数:mnmnwmxM )(| )(|5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)28 x ( n ) Mn w ( n ) 图 3.9 短时平均幅度 |x ( n )| | . | Mn与与En的比较:的比较: 1. Mn能较好地反映清音范围内的幅度变化;能较好地
18、反映清音范围内的幅度变化; 2. Mn所能反映幅度变化的动态范围比所能反映幅度变化的动态范围比En好;好; 3. Mn反映清音和浊音之间的电平差次于反映清音和浊音之间的电平差次于En。 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)29短时平均幅度函数随矩形窗窗长短时平均幅度函数随矩形窗窗长N变化的情况变化的情况5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)303.5 短时平均过零率短时平均过零率 1. 定义定义 在离散时间语音信号情况下,如果相邻的采在离散时间语音信号情况下,如果相邻的采样具有不同的代数符号就称为发生了过零。
19、单位样具有不同的代数符号就称为发生了过零。单位时间内过零的次数就称为过零率。时间内过零的次数就称为过零率。短时平均过零短时平均过零率的定义为率的定义为 sgnsgn1sgnsgn1*nmZx mx mw nmx nx nw n 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)31 10120 nN w n N 其它1( )0 sgn( )1( )0 x n x n - x n及 在上式中,用在上式中,用1/2N 作为幅值,是考虑了对该窗口范作为幅值,是考虑了对该窗口范围内的过零数取平均的意思围内的过零数取平均的意思。 5/11/2022数字语音处理及MATLAB
20、仿真 张雪英编著(李红莲修改并主讲)32 考虑到考虑到w(n-m)的非零值范围为的非零值范围为n-m0,即,即mn,以及以及 n-mN-1,故故mn-N+1,因此,因此短时平均过零率短时平均过零率可可以改写为:以改写为:nNnmnmxmxNZ)1(|1-sgnsgn| 21 sgnsgn1sgnsgn1*nmZx mx mw nmx nx nw n (定义式)(定义式)5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)332. 实现短时平均过零率实现短时平均过零率 Nn x(n) Sgnx(n) 1 一阶差分 sgnxn -sgnxn-1 低通滤波 h(n)=w(
21、n) -1 +1 图图 3.11 语音信号的短时平均跨零数语音信号的短时平均跨零数 Sgn . 取绝对取绝对值值 . . 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)34女声女声“我到北京去我到北京去”的短时平均过零次数的变化曲线的短时平均过零次数的变化曲线:5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)353. 应用应用 清音过零率高,浊音过零率低。清音过零率高,浊音过零率低。 局限性:浊音和清音重叠区域只根据短时平均局限性:浊音和清音重叠区域只根据短时平均过零率不可能明确地判别清、浊音。过零率不可能明确地判别清、浊音。
22、清音清音 浊音浊音 0 10 20 30 40 50 60 70 80 每每 10ms 内的过零数内的过零数 过零率概率分布过零率概率分布 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)36端点检测端点检测 端点检测目的:从包含语音的一段信号中确端点检测目的:从包含语音的一段信号中确定出语音的起点及结束点。定出语音的起点及结束点。 有效的端点检测不仅能使处理时间减到最少,有效的端点检测不仅能使处理时间减到最少,而且能抑制无声段的噪声干扰,提高语音处理的而且能抑制无声段的噪声干扰,提高语音处理的质量。质量。5/11/2022数字语音处理及MATLAB仿真 张雪英
23、编著(李红莲修改并主讲)373.6 短时自相关分析短时自相关分析 3.6.1 短时自相关函数短时自相关函数 时域离散确定信号的自相关函数定义为:时域离散确定信号的自相关函数定义为: 时域离散随机信号的自相关函数定义为:时域离散随机信号的自相关函数定义为: 周期为周期为P的周期信号满足:的周期信号满足: )( mkmxmxkR NNmNkmxmxNkR 121lim PkRkR5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)38 自相关函数具有下述性质:自相关函数具有下述性质: (1) 对称性对称性 R(k)= R(-k) (2) 在在k = 0处为最大值,即对于
24、所有处为最大值,即对于所有k来说,来说, |R(k)|R(0) (3) 对于确定信号,对于确定信号,R(0)对应于能量对应于能量 对于随机信号,对于随机信号,R(0)对应于平均功率对应于平均功率 5/11/2022数字语音处理及MATLAB仿真 张雪英编著(李红莲修改并主讲)39 采用短时分析方法,定义语音信号短时自相关函数为采用短时分析方法,定义语音信号短时自相关函数为 mnmknwkmxmnwmxkR因为因为 nnRkRk所以所以 nnmR kRkx m x m k w n m w n m k 3.6.2 语音信号的短时自相关函数语音信号的短时自相关函数 5/11/2022数字语音处理及M
展开阅读全文