语音信号处理复习资料要点课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语音信号处理复习资料要点课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 复习资料 要点 课件
- 资源描述:
-
1、Speech Signal Processing 中国矿业大学中国矿业大学 信息工程系信息工程系全书三篇,全书三篇,16章(讲章(讲15章)章)第一篇第一篇 语音信号处理基础语音信号处理基础第二章第二章 语音信号处理的基础知识语音信号处理的基础知识第一章第一章 绪论绪论第二篇第二篇 语音信号分析语音信号分析第三章第三章 语音信号的时域分析语音信号的时域分析第四章第四章 语音信号的短时傅里叶分析语音信号的短时傅里叶分析第五章第五章 语音信号的同态滤波及倒谱分析语音信号的同态滤波及倒谱分析第六章第六章 语音信号的线性预测分析语音信号的线性预测分析第七章第七章 语音信号的矢量量化语音信号的矢量量化第
2、八章第八章 隐马尔可夫模型(隐马尔可夫模型(HMMHMM)第九章第九章 语音检测分析语音检测分析第三篇第三篇 语音信号处理技术与应用语音信号处理技术与应用第第 十十 章章 语音编码(一)语音编码(一) 波形编码波形编码 第十一章第十一章 语音编码(二)语音编码(二) 声码器技术与混合编码声码器技术与混合编码第十二章第十二章 语音合成语音合成第十三章第十三章 语音识别语音识别第十四章第十四章 说话人识别说话人识别第十五章第十五章 语音增强语音增强第二章第二章 语音信号处理的基础知识语音信号处理的基础知识语音的产生语音的产生语音的分类语音的分类语音的基本特性语音的基本特性语音的时间波形和频谱特性语
3、音的时间波形和频谱特性语音信号的统计特性语音信号的统计特性声道模型声道模型语音信号语音信号的产生模型的产生模型激励模型激励模型辐射模型辐射模型声管模型声管模型共振峰模型共振峰模型级联型级联型并联型并联型混合型混合型语音感知语音感知定义定义人耳的听力范围人耳的听力范围声音的三要素声音的三要素掩蔽效应掩蔽效应第二章第二章思考题:思考题:1. 什么叫语言?什么叫语音?什么叫语言?什么叫语音?2. 人类的发音器官包括哪些?在发音时各起了人类的发音器官包括哪些?在发音时各起了什么作用?什么作用?3. 解释以下概念:基音频率、共振峰、浊音、解释以下概念:基音频率、共振峰、浊音、清音。清音。4. 语音信号模
4、型包括哪些子模型?激励模型和语音信号模型包括哪些子模型?激励模型和辐射模型各属于什么性质的滤波器?辐射模型各属于什么性质的滤波器?第三章语音信号的时域分析第三章语音信号的时域分析语音处理的目的语音处理的目的语音信号分析方法语音信号分析方法短时分析技术短时分析技术语音信号的语音信号的数字化和预处理数字化和预处理取样率的选择取样率的选择量化字长的选择量化字长的选择预处理预处理短时能量分析短时能量分析短时平均能量的定义短时平均能量的定义窗口形状的选择窗口形状的选择窗口的长度窗口的长度主要用途主要用途直角窗和海明窗直角窗和海明窗的频率特性比较的频率特性比较短时平均幅度短时平均幅度短时过零分析短时过零分
5、析过零分析的概念过零分析的概念短时平均过零数的实现短时平均过零数的实现短时平均过零数的应用短时平均过零数的应用短时相关分析短时相关分析自相关函数的定义自相关函数的定义自相关函数的性质自相关函数的性质短时自相关函数的定义短时自相关函数的定义修正的短时自相关函数修正的短时自相关函数短时平均幅度差函数短时平均幅度差函数(AMDF)相关分析相关分析第三章第三章思考题:思考题:1. 在语音信号参数分析前为什么要进行预处在语音信号参数分析前为什么要进行预处理,有哪些预处理过程?理,有哪些预处理过程?2. 短时平均能量(平均幅度)和短时平均过短时平均能量(平均幅度)和短时平均过零率的定义。这两种时域参数的用
6、途。窗口零率的定义。这两种时域参数的用途。窗口函数的长度和形状对它们有什么影响?函数的长度和形状对它们有什么影响?3. 短时自相关函数和短时平均幅度差函数定短时自相关函数和短时平均幅度差函数定义和用途,它们间有什么差异?义和用途,它们间有什么差异?第四章第四章 语音信号的短时傅里叶分析语音信号的短时傅里叶分析 短时傅里叶变换的定义短时傅里叶变换的定义短时傅里叶变换的取样率短时傅里叶变换的取样率标准傅里叶变换的解释标准傅里叶变换的解释滤波器的解释滤波器的解释语音信号的短时综合语音信号的短时综合滤波器组求和法滤波器组求和法语谱图可同时在时间和频率上显示语音频谱随可同时在时间和频率上显示语音频谱随时
7、间的变化时间的变化。第四章第四章思考题思考题:1.1. 语音信号的短时谱的定义。如何提高短语音信号的短时谱的定义。如何提高短时谱的频率分辨率?时谱的频率分辨率?2.2. 在求语音信号的短时谱时,对窗函数有在求语音信号的短时谱时,对窗函数有什么要求?什么要求? 对语音信号频谱分析采用海对语音信号频谱分析采用海明窗和矩形窗各有什么特点?明窗和矩形窗各有什么特点?3. 3. 什么是语谱图?它有什么特性?什么是语谱图?它有什么特性?第五章第五章 语音信号的同态滤波及倒谱分析语音信号的同态滤波及倒谱分析 同态信号处理也叫同态滤波,它实现了将同态信号处理也叫同态滤波,它实现了将卷积关系卷积关系变换为求和关
8、系变换为求和关系的分离处理。的分离处理。复倒谱和倒谱复倒谱和倒谱同态信号处理的基本原理同态信号处理的基本原理 卷积同态系统模型卷积同态系统模型特征系统特征系统D D* * 和和D D* *-1-1 的三步数学运算的三步数学运算语音信号两个卷积分量的复倒谱语音信号两个卷积分量的复倒谱避免相位卷绕的算法避免相位卷绕的算法最小相位信号序列:最小相位信号序列:信号的零极点全部在信号的零极点全部在z z平面单位圆内。平面单位圆内。1.卷积同态系统的组成及意义?特征系统卷积同态系统的组成及意义?特征系统D* 和逆特征和逆特征系统系统D*-1 运算的三个步骤是什么?运算的三个步骤是什么?2. 什么是复倒谱?
9、什么是倒谱?清、浊音的复倒谱或倒什么是复倒谱?什么是倒谱?清、浊音的复倒谱或倒谱各有什么特点?谱各有什么特点?第五章第五章思考题:思考题:主要内容主要内容6.16.1概述概述6.26.2线性预测分析的基本原理线性预测分析的基本原理6.36.3线性预测分析的解法线性预测分析的解法自相关法自相关法6.46.4格型法格型法6.56.5线性预测分析应用线性预测分析应用 -LPC-LPC谱估计和谱估计和LPCLPC复倒谱复倒谱线性预测分析就是根据已知信号线性预测分析就是根据已知信号s(n)s(n)对各对各参数参数 和增益和增益G G进行估计。在这里进行估计。在这里 为线性预测系数为线性预测系数 ia i
10、a F(z)s(n)图图6-3 6-3 线性预测器线性预测器)( ns piiizazF1)( piiizazFzA11)(1)(A(z)s(n)e(n) H(z)u(n)s(n)图图6-1 6-1 信号信号s(n)s(n)的模型化的模型化为实数为实数,ipiiiazazH 11G)(1.1.如何将信号模型化为模型参数?最常用的是如何将信号模型化为模型参数?最常用的是什么模型?什么叫线性预测?什么叫逆滤波器?什么模型?什么叫线性预测?什么叫逆滤波器?2. 2. 什么叫什么叫LPCLPC参数?参数?PARCORPARCOR参数?参数?LSPLSP参数?参数?3.3.什么是什么是LPCLPC谱?谱
11、?LPCLPC谱估计的特点。谱估计的特点。第六章第六章思考题:思考题:7.17.1概述概述7.27.2矢量量化的基本原理矢量量化的基本原理7.37.3失真测度失真测度7.47.4最佳矢量量化器和码本设计最佳矢量量化器和码本设计7.57.5降低复杂度的矢量量化系统降低复杂度的矢量量化系统7.67.6语音参数的矢量量化语音参数的矢量量化1.1.矢量量化的定义矢量量化的定义2.2.什么是失真测度?常用的失真测度有哪什么是失真测度?常用的失真测度有哪些?些?3. 3. 矢量量化器最佳设计的两个条件?矢量量化器最佳设计的两个条件?4. LBG算法算法 第七章第七章思考题:思考题:8.1 8.1 概述概述
12、8.2 8.2 隐马尔可夫模型的引入隐马尔可夫模型的引入8.3 8.3 隐马尔可夫模型的定义隐马尔可夫模型的定义8.4 8.4 隐马尔可夫模型三项问题的求解隐马尔可夫模型三项问题的求解 1.1.什么叫做隐马尔可夫过程?为什什么叫做隐马尔可夫过程?为什么说语音信号可以看成隐马尔可夫过么说语音信号可以看成隐马尔可夫过程?隐马尔可夫模型有哪些模型参数?程?隐马尔可夫模型有哪些模型参数?请叙述这些参数的含义和定义式请叙述这些参数的含义和定义式。 2. HMM2. HMM模型的结构主要有哪两种?模型的结构主要有哪两种?主要用在什么场合?主要用在什么场合? 3.3.转移概率矩阵的计算。转移概率矩阵的计算。
13、第八章第八章思考题思考题语音检测分析语音检测分析语音特征参数的提取和分析。语音特征参数的提取和分析。主要包括:基音检测和共振峰参数的估值。主要包括:基音检测和共振峰参数的估值。简化逆滤波法(简化逆滤波法(SIFTSIFT)基音检测基音检测倒谱法倒谱法自相关法自相关法共振峰估值共振峰估值1. 带通滤波器法带通滤波器法2. DFT法法3. 倒谱法倒谱法4. LPC法法1.1.基音检测的自相关法中的中心削波处理的思基音检测的自相关法中的中心削波处理的思路及实现过程?路及实现过程?2.2.用倒谱法实现基音检测和共振峰检测的原理?用倒谱法实现基音检测和共振峰检测的原理?第九章第九章思考题思考题语音编码的
14、概念、应用和分类等语音编码的概念、应用和分类等语音信号的压缩编码原理语音信号的压缩编码原理 对语音进行压缩编码的两个基本依据等对语音进行压缩编码的两个基本依据等 语音通信中的语音质量语音通信中的语音质量 脉冲编码调制脉冲编码调制(PCM)及其自适应及其自适应 自适应量化分为前馈或反馈两种自适应量化分为前馈或反馈两种预测编码及其自适应预测编码及其自适应APC 自适应预测编码自适应预测编码APC系统框图、总量化误差系统框图、总量化误差 预测编码可以改善信噪比的原因预测编码可以改善信噪比的原因 短时预测和长时预测短时预测和长时预测自适应差分编码调制(自适应差分编码调制(ADPCM)1.1.在语音通信
15、中,常将语音质量分为哪四等?在语音通信中,常将语音质量分为哪四等?2.2.语音信号能进行压缩编码的依据是什么?语语音信号能进行压缩编码的依据是什么?语音编码的分类?音编码的分类?3.3.自适应的控制量有几个?控制方式有几种,自适应的控制量有几个?控制方式有几种,其特点是什么?其特点是什么?4.4.预测编码可以改善信噪比的原因是什么?预测编码可以改善信噪比的原因是什么?5.5.什么是短时预测和长时预测什么是短时预测和长时预测 ?第十章思考题第十章思考题 参数编码概念、与波形编码的不同参数编码概念、与波形编码的不同声码器的基本结构声码器的基本结构相位声码器和通道声码器相位声码器和通道声码器同态声码
16、器同态声码器线性预测声码器线性预测声码器混合编码:混合编码: MPLPC 、CELP原理、原理、传输码率计算等传输码率计算等第十一章第十一章 语音编码声码器技术及混合编码语音编码声码器技术及混合编码 语音合成的方法:语音合成的方法:波形合成法波形合成法 、参数合成法参数合成法规则合成法规则合成法 语音合成系统的特性语音合成系统的特性:形式有两种形式有两种 用预测器系数用预测器系数ai直接构成的递归型合成滤波器直接构成的递归型合成滤波器 采用反射系数构成的格型合成滤波器采用反射系数构成的格型合成滤波器第十三章第十三章 语音识别语音识别 语音识别的概念、目的和分类语音识别的概念、目的和分类 语音识
17、别原理:语音识别原理:模式匹配原理、语音识别的步骤模式匹配原理、语音识别的步骤 框图理解框图理解动态时间规整(动态时间规整(DTW):):目的、原理目的、原理孤立词识别系统:孤立词识别系统:原理和框图理解原理和框图理解 端点检测的作用端点检测的作用1.什么是语音识别什么是语音识别?语音识别系统如何分类语音识别系统如何分类?当前当前,语音语音识别的主流方法是什么识别的主流方法是什么?2.语音识别系统由哪几个部分组成语音识别系统由哪几个部分组成?语音识别中常用的语音识别中常用的语音特征参数有哪些语音特征参数有哪些?3.什么是动态时间规整什么是动态时间规整?实际中实际中,它解决了什么问题它解决了什么
18、问题?4.孤立词识别系统框图孤立词识别系统框图?框图中框图中,参考模式库和模式识别参考模式库和模式识别的作用是什么的作用是什么?第十三章思考题第十三章思考题第十四章 说话人识别 说话人识别定义、目的和关键问题说话人识别定义、目的和关键问题说话人识别分类、应用说话人识别分类、应用特征提取特征提取 说话人识别所用的特征说话人识别所用的特征 特征类型的优选准则:特征类型的优选准则: F比作为有效性准则比作为有效性准则 说话人识别系统的结构:说话人识别系统的结构: 组成、基本结构、说话人识别系统的性能评组成、基本结构、说话人识别系统的性能评价价 如:说话人确认系统最重要的两个性能指标:如:说话人确认系
19、统最重要的两个性能指标: 错误拒绝率(错误拒绝率(FR)、错误接受率()、错误接受率(FA) 说话人识别中的识别方法说话人识别中的识别方法 DTW型说话人识别系统:说话人确认系统型说话人识别系统:说话人确认系统 应用应用VQ的说话人识别系统:说话人辨认系统的说话人识别系统:说话人辨认系统1.说话人识别和语音识别的区别在什么地方说话人识别和语音识别的区别在什么地方? 2.说话人确认和说话人辨认有什么不同?说话人确认和说话人辨认有什么不同?3.在说话人识别中,应选择哪些可以表征个人特征在说话人识别中,应选择哪些可以表征个人特征的识别参数?的识别参数?4.怎样评价说话人识别特征参数选取的好坏?即怎样
20、评价说话人识别特征参数选取的好坏?即F比的物理意义?比的物理意义?5.说话人确认系统最重要的两个性能指标是什么?说话人确认系统最重要的两个性能指标是什么?含义为什么?含义为什么?6.基于基于DTW和和VQ算法的系统框图理解。算法的系统框图理解。第十四章思考题第十四章思考题人类的语音是由人体发音器官在大脑控制下的人类的语音是由人体发音器官在大脑控制下的生理运动产生的生理运动产生的;人的发音器官包括:肺、气管、喉、咽、鼻、人的发音器官包括:肺、气管、喉、咽、鼻、口等。口等。声带开启和闭合使气流形成一系列脉冲。声带开启和闭合使气流形成一系列脉冲。 每开启和闭合一次的时间即振动周期称为每开启和闭合一次
21、的时间即振动周期称为基音周期基音周期,其倒数为,其倒数为基音频率基音频率,简称,简称基频。基频。基基频决定了声音频率的高低,频率快则音调高,频决定了声音频率的高低,频率快则音调高,频率慢则音调低。频率慢则音调低。 基音的范围约为基音的范围约为70 - 350Hz70 - 350Hz, ,与说话人与说话人的性别、年龄等情况有关。的性别、年龄等情况有关。 语音由声带振动或不经声带振动来产生,其中:语音由声带振动或不经声带振动来产生,其中: 由声带振动产生的音称为由声带振动产生的音称为浊音(浊音(Voice SpeechVoice Speech); 不由声带振动产生的音称为不由声带振动产生的音称为清
22、音清音(Unvoice Speech) 。 使声道完全闭合,在闭合后建立起气压,然后突然释使声道完全闭合,在闭合后建立起气压,然后突然释放,得到爆破音称为放,得到爆破音称为爆破音(爆破音(plosive Speech):):声道可以等效为一个谐振腔,有许多谐振频率。谐振频率由声道可以等效为一个谐振腔,有许多谐振频率。谐振频率由每一瞬间的声道外形来决定。每一瞬间的声道外形来决定。 若声道截面是均匀的,则谐振频率发生在:若声道截面是均匀的,则谐振频率发生在:.3 , 2 , 14)12( nLcnFn c c为声速,空气中为为声速,空气中为350m/s350m/s,L L为声道长度,为声道长度,n
展开阅读全文