书签 分享 收藏 举报 版权申诉 / 17
上传文档赚钱

类型人工智能语音识别-ppt课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2796495
  • 上传时间:2022-05-26
  • 格式:PPT
  • 页数:17
  • 大小:757.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《人工智能语音识别-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    人工智能 语音 识别 ppt 课件
    资源描述:

    1、语音识别语音识别1PPT课件目录 语音识别的定义语音识别的定义 语音识别涉及领域语音识别涉及领域 语音识别的类型语音识别的类型 语音识别原理框图语音识别原理框图 DTWDTW算法算法 语音识别系统应用领域语音识别系统应用领域 语音识别技术的应用发展方向语音识别技术的应用发展方向2PPT课件语音识别的定义语音识别的定义语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。它是语音信号处理学科的一个分支。语音识别系统的本质就是一种模式识别系统。常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型

    2、(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)3PPT课件语音识别涉及领域语音识别涉及领域信号处理物理学(声学)模式匹配通信及信息理论语言语音学生理学计算机科学心理学4PPT课件语音识别的类型语音识别的类型 孤立单词识别孤立单词识别 连续语音识别连续语音识别 连续单词识别连续单词识别 连续言语识别与理解连续言语识别与理解按识别器的类按识别器的类型型 特定人语音识别特定人语音识别 非特定人语音识别非特定人语音识别按识别器对使按识别器对使用者的适应情用者的适应情况况 有限词汇识别有限词汇识别 无限词汇识别(全音节识别)无限词汇识别(全音节识别)按语音词汇表

    3、按语音词汇表的大小的大小5PPT课件语音识别原理框图语音识别原理框图6PPT课件DTW算法模板匹配方法的语音识别算法需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同。设参考模板有M帧矢量R(1),R(2),R(m),R(M),R(m)为第m帧的语音特征矢量,测试模板有N帧矢量T(1),T(2),T(n),T(N),T(n)是第n帧的语音特征矢量。d(T(in),R(im)表示T中第in帧特征与R中im帧特征之间的距离,通常用欧几里德距离表示。7PPT课件三种匹配模式的对比8PPT课件DTW算法DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=

    4、(in),将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:D就是处于最优时间规整情况下两矢量的距离。9PPT课件DTW算法通常规整函数必须满足如下的约束条件:边界限制单调性限制连续性限制10PPT课件DTW算法算法DTW算法的原理图如图把测试模板的各个帧号n=1N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧m=1M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点(ti,rj)表示测试模式中某一帧与训练模式中某一帧的交汇。DTW算法分两步进行,一是计算两个模式各帧之间的距离,即求出帧匹配距离矩阵,二是在帧匹配距离矩阵中找

    5、出一条最佳路径。11PPT课件DTW算法12PPT课件DTW算法搜索从(1,1)点出发,对于局部路径约束如图5-3,点(in,im)可达到的前一个格点只可能是(in-1,im)、(in-1,im-l)和(in-1,im-2)。那么(in,im)一定选择这三个距离中的最小者所对应的点作为其前续格点,这时此路径的累积距离为:D(in,im)=d(T(in),R(im)+minD(in-1,im),D(in-1,im-1),D(in-1,im-2)13PPT课件语音识别系统应用领域语音识别系统应用领域 电话通信的语音拨电话通信的语音拨号号 特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随

    6、着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。 汽车的语音控制汽车的语音控制 对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。 工业控制及医疗领域工业控制及医疗领域 当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。14PPT课件语音识别系统应用领域语音识别系统应用领域 个人数字助理的语音交互界面个人数字助理的语音交互界面 PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识

    7、别的方法输入和查询信息。随着语音识别技术的提高,语音将成为PDA主要的人机交互界面。 智能玩具智能玩具 家电遥控家电遥控 用语音可以控制电视机、VCD、空调、电扇、窗帘的操作,而且一个遥控器就可以把家中的电器皆用语音控起来。15PPT课件语音识别技术的应用发展方向语音识别技术的应用发展方向 一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的; 另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片和语音识别片上系统的出现。16PPT课件Thank you!17PPT课件

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:人工智能语音识别-ppt课件.ppt
    链接地址:https://www.163wenku.com/p-2796495.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库