解析深度学习:语音识别实践课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《解析深度学习:语音识别实践课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解析 深度 学习 语音 识别 实践 课件
- 资源描述:
-
1、解析深度学习:语音识别实践作者及译者简介01Part One作者及译者简介术语缩写02Part One术语缩写符号03Part One符号 1 简介04Part One1 简介011.1.1 人类之间的交流1.1.2 人机交流1.1 自 动 语 音 识 别:更 好 的 沟 通 之 桥02 1.2 语音识别系统的基本结构031.3.1 第一部分:传统声学模型1.3.2 第二部分:深度神经网络1.3.3 第三部分:语音识别中的DNN-HMM混合系统1.3.4 第四部分:深度神经网络中的特征表示学习1.3.5 第五部分:高级的深度模型1.3 全书结构第一部分 传统声学模型05Part One2 混合
2、高斯模型第一部分 传统声学模型2.2 高斯分布和混合高斯随机变量2.4 采用混合高斯分布对语音特征建模2.1 随机变量2.3 参数估计3 隐马尔可夫模型及其变体3.1 介绍3.2 马尔可夫链3.3 序列与模型3.4 期望最大化算法及其在学习HMM参数中的应用3.5 用于解码HMM状态序列的维特比算法3.6 隐马尔可夫模型和生成语音识别模型的变体3 隐马尔可夫模型及其变体3.3 序列与模型3.3.1 隐马尔可夫模型的性质3.3.2 隐马尔可夫模型的仿真3.3.3 隐马尔可夫模型似然度的计算3.3.4 计算似然度的高效算法3.3.5 前向与后向递归式的证明3 隐马尔可夫模型及其变体3.4 期望最大
3、化算法及其在学习HMM参数中的应用3.4.1 期望最大化算法介绍3.4.2 使用EM算法来学习HMM参数Baum-Welch算法3 隐马尔可夫模型及其变体3.5 用于解码HMM状态序列的维特比算法3.5.1 动态规划和维特比算法3.5.2 用于解码HMM状态的动态规划算法3 隐马尔可夫模型及其变体3.6 隐马尔可夫模型和生成语音识别模型的变体3.6.1 用于语音识别的GMM-HMM模型3.6.2 基于轨迹和隐藏动态模型的语音建模和识别3.6.3 使用生成模型HMM及其变体解决语音识别问题第二部分 深度神经网络06Part One4 深度神经网络4.2 使用误差反向传播来进行参数训练4.1 深度
4、神经网络框架4.3 实际应用4 深度神经网络4.2 使用误差反向传播来进行参数训练4.2.1 训练准则4.2.2 训练算法4 深度神经网络4.3 实际应用4.3.1 数据预处理4.3.2 模型初始化4.3.3 权重衰减4.3.4 丢弃法4.3.5 批量块大小的选择4 深度神经网络4.3 实际应用4.3.6 取样随机化4.3.7 惯性系数4.3.8 学习率和停止准则4.3.9 网络结构4.3.10 可复现性与可重启性5 高级模型初始化技术5.1 受限玻尔兹曼机5.2 深度置信网络预训练5.3 降噪自动编码器预训练5.4 鉴别性预训练5.5 混合预训练5.6 采用丢弃法的预训练5.1.1 受 限
5、玻 尔兹 曼 机 的 属 性5.1.2 受 限 玻 尔兹 曼 机 参 数 学 习 第三部分 语音识别中的深度神经网络隐马尔可夫混合模型07Part One6 深度神经网络隐马尔可夫模型混合系统6.2 CD-DNN-HMM的关键模块及分析6.1 DNN-HMM混合系统6.3 基于KL距离的隐马尔可夫模型6 深度神经网络隐马尔可夫模型混合系统6.1 DNN-HMM混合系统6.1.1 结构6.1.2用CD-DNN-HMM解码6.1.3 CD-DNN-HMM训练过程6.1.4 上下文窗口的影响6 深度神经网络隐马尔可夫模型混合系统6.2 CD-DNN-HMM的关键模块及分析6.2.1 进行比较和分析的
6、数据集和实验6.2.2 对单音素或者三音素的状态进行建模6.2.3 越深越好6.2.4 利用相邻的语音帧6.2.5 预训练6.2.6 训练数据的标注质量的影响6.2.7 调整转移概率7 训练和解码的加速7.1 训练加速7.2 加速解码7 训练和解码的加速7.1 训练加速7.1.1 使用多GPU流水线反向传播7.1.2 异步随机梯度下降7.1.3 增广拉格朗日算法及乘子方向交替算法7.1.4 减小模型规模7.1.5 其他方法7 训练和解码的加速7.2 加速解码7.2.1 并行计算7.2.2 稀疏网络7.2.3 低秩近似7.2.4 用大尺寸DNN训练小尺寸DNN7.2.5 多帧DNN8 深度神经网
7、络序列鉴别性训练8.1 序列鉴别性训练准则8.2 具体实现中的考量8.3 噪声对比估计8 深度神经网络序列鉴别性训练8.1 序列鉴别性训练准则8.1.1 最大相互信息8.1.2 增强型MM I8.1.3 最小音素错误/状态级最小贝叶斯风险8.1.4 统一的公式8 深度神经网络序列鉴别性训练8.2 具体实现中的考量8.2.1 词图产生8.2.2 词图补偿8.2.3 帧平滑8.2.4 学习率调整8.2.5 训练准则选择8.2.6 其他考量8 深度神经网络序列鉴别性训练8.3 噪声对比估计8.3.1 将概率密度估计问题转换为二分类设计问题8.3.2 拓展到未归一化的模型8.3.3 在深度学习网络训练
展开阅读全文