语音处理与语音识别简介)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语音处理与语音识别简介)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 处理 识别 简介 课件
- 资源描述:
-
1、1语音处理与语音识别简介2014年9月2主要内容主要内容数字音频基础知识音频处理基础知识语音识别技术简介3主要内容主要内容数字音频基础知识数字音频基础知识音频处理基础知识语音识别技术简介4 是指自然声是指自然声 是机械振动在弹性介质中传播的机械波是机械振动在弹性介质中传播的机械波 是随时间连续变化的物理量是随时间连续变化的物理量 声音概念声音概念 振幅振幅 波的高低幅度,表示声音的强弱波的高低幅度,表示声音的强弱 周期周期 两个相邻波之间的时间长度两个相邻波之间的时间长度 频率频率 每秒钟波振动的次数,单位是每秒钟波振动的次数,单位是 Hz 声音特性声音特性5声音的强度声音的强度(响度或音量响
2、度或音量),与声波振幅成,与声波振幅成正比;唱盘、正比;唱盘、CD 盘等声音载体中的音强盘等声音载体中的音强不变,通过播放设备的音量控制可改变聆不变,通过播放设备的音量控制可改变聆听时强度;音频处理软件可提高声源音强听时强度;音频处理软件可提高声源音强声音的特色,主要影响因素是复音;复声音的特色,主要影响因素是复音;复音指具有不同频率和不同振幅的混合声音指具有不同频率和不同振幅的混合声音,其中最低频率是音,其中最低频率是“基音基音”,是声音的,是声音的基调,其他频率的声音为基调,其他频率的声音为“谐音谐音(泛音泛音)”代表声音的高低,与频率有关;使代表声音的高低,与频率有关;使用音频处理软件对
3、声音的频率进行用音频处理软件对声音的频率进行调整时,其音调也会随之发生变化调整时,其音调也会随之发生变化 声音的三要素声音的三要素 音调音调 (高低高低)音强音强 (强弱强弱)音色音色 (特质特质)6 声音的频率范围声音的频率范围7数字音频数字音频声音是振动的机械波,话筒把机械振动转换成电信号,用随时间连声音是振动的机械波,话筒把机械振动转换成电信号,用随时间连续变化的物理量表示,称之为模拟音频。续变化的物理量表示,称之为模拟音频。在计算机内部,所有的信息均以数字表示,代表声音信号的物理量在计算机内部,所有的信息均以数字表示,代表声音信号的物理量也用一系列数字表示,称之为数字音频。也用一系列数
4、字表示,称之为数字音频。模拟音频在时间上是连续的,而数字音频则是一个数据序列,在时模拟音频在时间上是连续的,而数字音频则是一个数据序列,在时间上不具备连续性,因此只能是断续的。间上不具备连续性,因此只能是断续的。当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音当把模拟声音变成数字声音时,需要每隔一个时间间隔在模拟声音波形上取一个电压幅度值,称之为波形上取一个电压幅度值,称之为。采样得到的表示声音强弱的模拟电压幅值是连续的,把无穷多个电采样得到的表示声音强弱的模拟电压幅值是连续的,把无穷多个电压幅值用有限个数字表示,称之为压幅值用有限个数字表示,称之为。8 采样采样采样过程采样过程按固
5、定间隔按固定间隔采样声音波形采样声音波形采样声音波采样声音波形之后的结果形之后的结果声波是连续信号,声波是连续信号,或称连续时间函数或称连续时间函数 x(t)。用计算机处理这些信号时应先用计算机处理这些信号时应先离散化,即按一定的时间间隔离散化,即按一定的时间间隔(T)取值,得到取值,得到 x(nT)(n为整数为整数),T 称采样称采样周期,周期,1/T 称采样频率称采样频率(每秒钟采样次数每秒钟采样次数),x(nT)称采样值称采样值(或离散信号或离散信号)采样概念采样概念9设连续信号设连续信号 x(t)的频谱为的频谱为 x(f),以采样间隔,以采样间隔 T 采样得到离散信号采样得到离散信号
6、x(nT)如果满足:当如果满足:当|f|fc(fc 是信号高端截止频率是信号高端截止频率)时,有时,有T 1/(2fc)或或 fc 1/(2T)则可由则可由 x(nT)完全确定完全确定 x(t)。当当 fN=1/(2T)时,称时,称 fN 为奈奎斯特频率为奈奎斯特频率采样定理采样定理奈奎斯特奈奎斯特(Nyqust)采样定理:只要采样频率大于或者等于信号中所包采样定理:只要采样频率大于或者等于信号中所包含的最高频率的两倍;即当信号是最高频率时,每个周期至少采样两个含的最高频率的两倍;即当信号是最高频率时,每个周期至少采样两个点,则理论上就可以完全恢复原来的信号。点,则理论上就可以完全恢复原来的信
7、号。采样采样采样方法采样方法语音信号频谱在高频处迅速下降,但非限带。应用时只对一定频率范围语音信号频谱在高频处迅速下降,但非限带。应用时只对一定频率范围内的信号感兴趣,就可以对经滤波限带的音频信号采样。这样,在采样内的信号感兴趣,就可以对经滤波限带的音频信号采样。这样,在采样前,用一个锐截止模拟低通滤波器对音频信号进行滤波。前,用一个锐截止模拟低通滤波器对音频信号进行滤波。10 量化量化通过采样得到的表示声音强弱的函数通过采样得到的表示声音强弱的函数 x(nT)是连续的,为把是连续的,为把 x(nT)存入计存入计算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合算机,就必须将采样值离散
8、化,即量化成一个有限个幅度值的集合 x(nT)量化概念量化概念量化原理量化原理先将整个幅度划分成为有限个小幅度先将整个幅度划分成为有限个小幅度(量化阶距量化阶距)的集合,把落入某个阶距的集合,把落入某个阶距内的样值归为一类,并赋予相同的量内的样值归为一类,并赋予相同的量化值。如果量化值是均匀分布的,称化值。如果量化值是均匀分布的,称为均匀量化。设为均匀量化。设 为量化阶距,量化为量化阶距,量化器最大范围是器最大范围是 Xmax,则:,则:=2Xmax/2B量化电压幅量化电压幅值之后的结果值之后的结果11 编码编码音频模拟信号经过采样与量化之后,为把数字化音频存入计算机,需对音频模拟信号经过采样
9、与量化之后,为把数字化音频存入计算机,需对其编码,即用二进制数表示每个采样的量化值,完成整个模数转换过程其编码,即用二进制数表示每个采样的量化值,完成整个模数转换过程编码概念编码概念PCM 编码编码一种最方便简单的编码方法是脉冲编一种最方便简单的编码方法是脉冲编码调制,常称为码调制,常称为 PCM(Pulse CodeModulation)编码。是一种未经压缩编码。是一种未经压缩的数字音频信号,常作为一种参考信的数字音频信号,常作为一种参考信号,以便其他编码方法与之比较,或号,以便其他编码方法与之比较,或者在此基础上作进一步压缩编码处理者在此基础上作进一步压缩编码处理12 衡量一种编码方法的性
10、能有两个主要指标:码流速率和量化噪声衡量一种编码方法的性能有两个主要指标:码流速率和量化噪声 码流速率指的是音频信号编码流速率指的是音频信号编码后每秒钟产生的数据流量,以码后每秒钟产生的数据流量,以kbit/s 为单位表示,也可以表示为单位表示,也可以表示为为 kbps。例如对普通模拟话音。例如对普通模拟话音用用 8kHz 的频率采样并以的频率采样并以 8 位量位量化和编码,所形成的音频数字信化和编码,所形成的音频数字信号的码率便是号的码率便是 64kbps。量化噪声是由量化失真引起量化噪声是由量化失真引起的噪声,通常表示为量化后的音的噪声,通常表示为量化后的音频信号噪声比,简称信噪比。每频信
展开阅读全文