第十讲-语音信号处理第5章分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十讲-语音信号处理第5章分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 语音 信号 处理 分析 课件
- 资源描述:
-
1、回顾回顾5.55.5隐马尔科夫模型的各种结构类隐马尔科夫模型的各种结构类型型5.65.6隐马尔科夫模型的一些实际问隐马尔科夫模型的一些实际问题题5.5 5.5 隐马尔可夫模型的各种结构类隐马尔可夫模型的各种结构类型型 按照按照HMMHMM的状态转移概率矩阵(参数)分类的状态转移概率矩阵(参数)分类 各态历经型或遍历型各态历经型或遍历型HMMHMM(Ergodic HMMErgodic HMM) : :严格的讲,所严格的讲,所谓的遍历模型就是经过有限步的转移后,系统能达到任何谓的遍历模型就是经过有限步的转移后,系统能达到任何一个状态。即系统从一个状态允许转移到任何一个状态。一个状态。即系统从一个
2、状态允许转移到任何一个状态。在某些应用系统中,常遇到的是一步遍历模型,即经过一在某些应用系统中,常遇到的是一步遍历模型,即经过一步跳转,系统可达到任何一个状态。这样的步跳转,系统可达到任何一个状态。这样的HMMHMM的状态转的状态转移矩阵中的每一个元素均为大于零的数,没有零元素。显移矩阵中的每一个元素均为大于零的数,没有零元素。显然,各态历经型然,各态历经型HMMHMM不符合时间顺序的要求,因为它可以不符合时间顺序的要求,因为它可以回到以前到过的状态,所以只能用于不要求时间顺序的语回到以前到过的状态,所以只能用于不要求时间顺序的语音信号处理,如:与文本无关的说话人识别等。音信号处理,如:与文本
3、无关的说话人识别等。 从左到右型从左到右型HMMHMM(Left-to-Right HMMLeft-to-Right HMM):):所谓的从左到右模所谓的从左到右模型,就是指随着时间的增加,状态的转移只能是从左到右进型,就是指随着时间的增加,状态的转移只能是从左到右进行或停留在原来的状态,而不能出现返回到以前状态的情况,行或停留在原来的状态,而不能出现返回到以前状态的情况,即从编号高的状态(如第状态)到编号低的状态(如第即从编号高的状态(如第状态)到编号低的状态(如第n-1n-1或或n-2n-2等等状态等等状态)跳转的情况(这实际上是一个时序的问题,)跳转的情况(这实际上是一个时序的问题,因为
4、按照时间顺序,总是从编号低的状态向编号高的状态转因为按照时间顺序,总是从编号低的状态向编号高的状态转移)。因此,其状态转移矩阵具有如下的形式,它是一个上移)。因此,其状态转移矩阵具有如下的形式,它是一个上三角矩阵,而表示终止状态的最后一行除了最后一个元素外三角矩阵,而表示终止状态的最后一行除了最后一个元素外全为零(当终止状态没有自转移时,则最后一行全为零)。全为零(当终止状态没有自转移时,则最后一行全为零)。44343324232214131211000000aaaaaaaaaa另外从状态转移结构上另外从状态转移结构上HMMHMM还有还有其他的一些变体,如由图其他的一些变体,如由图5-55-5
5、(c c)所示的由两条并行的从左到右模所示的由两条并行的从左到右模型组成的型组成的HMMHMM,又称为,又称为HMMHMM网络。网络。它不是一般的情况,是由标准模它不是一般的情况,是由标准模型组合的变体,用于特殊的应用型组合的变体,用于特殊的应用场合。这种模型较复杂,所以性场合。这种模型较复杂,所以性能一般要比单个左右模型要好。能一般要比单个左右模型要好。 按照按照HMMHMM的输出概率分布(的输出概率分布(B B参数)分类参数)分类 离散离散HMMHMM(DHMMDHMM): :离散离散HMMHMM就是上面一直在介绍的就是上面一直在介绍的HMMHMM。在这种。在这种HMMHMM中,每一个状态
6、的输出概率是按观中,每一个状态的输出概率是按观察字符离散分布的,每一次转移时状态输出的字符,察字符离散分布的,每一次转移时状态输出的字符,是从一个有限的离散字符集中按照一定的离散概率是从一个有限的离散字符集中按照一定的离散概率分布选出的。在语音信号处理中,经过特征分析后,分布选出的。在语音信号处理中,经过特征分析后,语音信号先被分割成若干帧,每帧求取一个特征参语音信号先被分割成若干帧,每帧求取一个特征参数向量,即每帧是用一个特征参数向量表示的。此数向量,即每帧是用一个特征参数向量表示的。此时若要使用离散时若要使用离散HMMHMM,则需要将语音特征参数向量,则需要将语音特征参数向量的时间序列进行
7、矢量量化,通过矢量量化使每一帧的时间序列进行矢量量化,通过矢量量化使每一帧语音信号由特征参数向量表示转变为用码字符号表语音信号由特征参数向量表示转变为用码字符号表示的形式。示的形式。 连续型连续型HMMHMM(Continuous HMMContinuous HMM,简称为,简称为CHMMCHMM):在连续):在连续HMMHMM中,中,由于可以输出的是连续值,不是有限的,所以不能用矩阵表由于可以输出的是连续值,不是有限的,所以不能用矩阵表示输出概率,而要改用概率密度函数来表示。即用示输出概率,而要改用概率密度函数来表示。即用 表示:在表示:在 和和 之间观察矢量的输出概率。这里之间观察矢量的输
8、出概率。这里 称称为参数为参数 的概率密度分布函数,输出的概率密度分布函数,输出 的概率可以通过的概率可以通过 计算出来。计算出来。 一般用高斯概率密度函数,由于一般用高斯概率密度函数,由于 是多维矢是多维矢量所以要用多元高斯概率密度函数量所以要用多元高斯概率密度函数)(dXXbijXdXX )(XbijXX)(Xbij)(XbijX)()(exp),|()(121)2(12/12tijijijijXXjiXPXbijp 根据协方差矩阵是全协方差矩阵还是对角协方差矩阵,可以根据协方差矩阵是全协方差矩阵还是对角协方差矩阵,可以把连续把连续HMMHMM分成全协方差矩阵分成全协方差矩阵CHMMCHM
9、M和对角协方差矩阵和对角协方差矩阵CHMMCHMM。 另一方面,由于在实际的语音信号处理系统中,往往用一个另一方面,由于在实际的语音信号处理系统中,往往用一个高斯概率密度函数不足以表示语音参数的输出概率分布,所高斯概率密度函数不足以表示语音参数的输出概率分布,所以一种常用于语音信号处理的概率密度函数,称之为以一种常用于语音信号处理的概率密度函数,称之为“高斯高斯元混合密度元混合密度”,即用多个高斯概率分布的加权组合来表示输,即用多个高斯概率分布的加权组合来表示输出概率密度函数。出概率密度函数。 连续混合密度连续混合密度HMMHMM为多个正态分布线性相加的为多个正态分布线性相加的HMMHMM系统
10、,当系统,当M M值较大(如值较大(如M M为为4 4或或5 5)时,系统的识别率较高,但其运算量)时,系统的识别率较高,但其运算量较大。另一方面,每个模型中每个状态的概率密度由较大。另一方面,每个模型中每个状态的概率密度由M M个正个正态分布函数叠加而成,它比前者有更多的自由度,因而逼近态分布函数叠加而成,它比前者有更多的自由度,因而逼近实际分布的效果更好一些,这样识别效果也会更佳,随着词实际分布的效果更好一些,这样识别效果也会更佳,随着词汇量的增加,这一优点更加突出,因而,对一些大词汇量的汇量的增加,这一优点更加突出,因而,对一些大词汇量的与说话人无关的语音识别系统,连续混合密度与说话人无
11、关的语音识别系统,连续混合密度HMMHMM受到重视。受到重视。 )()(exp)()(121)2(1112/12tijmijmijmMmijmMmijmijmijXXwXbwXbijmp 半连续型半连续型HMMHMM(Semi-Continuous HMMSemi-Continuous HMM:简称为:简称为SCHMMSCHMM):离):离散散HMMHMM的模型参数少,对训练数据量要求不高,而且离散的模型参数少,对训练数据量要求不高,而且离散HMMHMM的计算量较少,易于实时实现,但是离散的计算量较少,易于实时实现,但是离散HMMHMM的缺点是识别的缺点是识别精度不高。连续型精度不高。连续型H
12、MMHMM虽然不使用离散概率分布不需要对输虽然不使用离散概率分布不需要对输入信号进行量化,从而提高了识别率,但这是以运算量的增入信号进行量化,从而提高了识别率,但这是以运算量的增加为代价的,而且连续型加为代价的,而且连续型HMMHMM尤其是连续混合密度尤其是连续混合密度HMMHMM的模型的模型参数教多,训练数据不够时训练的模型精度较低。为了结合参数教多,训练数据不够时训练的模型精度较低。为了结合这两种模型的优点,弥补这两种模型的缺点。人们提出了半这两种模型的优点,弥补这两种模型的缺点。人们提出了半连续型连续型HMMHMM,它的输出概率的形式如下式所示:,它的输出概率的形式如下式所示: 这样,对
13、于离散这样,对于离散HMMHMM,半连续型,半连续型HMMHMM用多个正态分布线性相加用多个正态分布线性相加作为概率密度函数弥补了离散分布的误差;对于连续型作为概率密度函数弥补了离散分布的误差;对于连续型HMMHMM,半连续型半连续型HMMHMM用多个各状态共有的正态分布线性相加作为概用多个各状态共有的正态分布线性相加作为概率密度函数弥补了参数数量多,计算量大的缺陷。率密度函数弥补了参数数量多,计算量大的缺陷。),(),(),|()(11kkJkijkkkJkijXNwXNjikPXb 其他一些特殊的其他一些特殊的HMMHMM的形式的形式 空转移(空转移(Null TransitionsNul
14、l Transitions): :在这种类型的在这种类型的HMMHMM中,系统的中,系统的输出是与转移弧相联系的,允许不产生输出的转移,即从一输出是与转移弧相联系的,允许不产生输出的转移,即从一个状态转移到其他状态时,无观察符号(或矢量)输出。这个状态转移到其他状态时,无观察符号(或矢量)输出。这样的转移称为空转移。样的转移称为空转移。在连续语音识别系统中,单词或语句在连续语音识别系统中,单词或语句的的HMMHMM都是由基元都是由基元HMMHMM的连接形成的,一般在连接时,一个基的连接形成的,一般在连接时,一个基元元HMMHMM的终止状态和一个基元的终止状态和一个基元HMMHMM的初始状态相连
15、接,这种连的初始状态相连接,这种连接产生的转移弧就是空转移,如图接产生的转移弧就是空转移,如图5-65-6所示。所以在大词汇所示。所以在大词汇连续语音识别系统中大量使用了这种模型。连续语音识别系统中大量使用了这种模型。 基元基元HMMHMM的连接的连接 音节HMM单词HMMnullnull连接连接 参数捆绑(参数捆绑(Parameter tieingParameter tieing) : :参数捆绑的基本思想是在参数捆绑的基本思想是在HMMHMM的不同状态转移弧的参数之间建立一定的关系,使得不的不同状态转移弧的参数之间建立一定的关系,使得不同状态转移弧使用相同的参数,其目的就是使模型中的独立同
展开阅读全文