鼾声与语音的时频区分特征毕业答辩通信课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《鼾声与语音的时频区分特征毕业答辩通信课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 鼾声 语音 区分 特征 毕业 答辩 通信 课件
- 资源描述:
-
1、鼾声与语音的时频区分特征Page 2本次演示的结构安排 课题准备 设计思路系统的过程实现实验结果和总结 出现的问题的探讨12345Page 3 1.1 课题的背景与意义课题背景研究意义鼾声是一种异常的呼吸音,由病变或睡眠姿势不对所引起。由于鼾声与许多疾病息息相关,在呼吸暂停综合征(OSAHS)等疾病的诊断上有着重要作用。针对现有鼾声诊断由于其他语音信号干扰造成的不足,人们越来越多的先通过语音信号处理录音再用计算机辅助分析。本次毕业设计提出运用matlab的语音端点检测技术,最大程度的区分出说话声,排除其在鼾声提取过程中的干扰,为鼾声的准确分析提供有效的技术支持。Page 4 1.2 课题研究现
2、状和思考频域参数方法近年来,随着人工智能的兴起,也可以通过支持向量机等模式识别的方式实现鼾声与说话声的精确区分。时域参数方法通过声学特征的自然成因差异来实现二者的区分。语音信号的识别经过前人在鼾声的时域特征上的分析,总结出了其在时域特征上的规律,我们可以通过这些使时域方法实现进一步的设计与应用。思考Page 5 2 设计思路录音样本大样本分析小样本分析预处理实验结果统计语音信号提取时域分析频域分析 本次设计主要运用鼾声和说话声在时域中持续时间的不同来实现时域方法上的准确区分。Page 6 3 系统的过程实现每段大样本时间为10分钟;每段小样本时间为5s-10s录音样本通常为整晚睡眠录音,一般持
3、续7-8小时matlab软件限制,正常情况下不能超过30分钟的音频读取分割所用软件:goldwave录音样本的选取与分割录音样本的选取与分割Page 7 3.2 小样本分析 11zz预加重 提升信号的高频部分,使其频谱变的平坦保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。加窗分帧语音信号具有短时平稳特性采用汉明窗、汉宁窗、矩形窗等,汉明窗低通特性较好分帧虽然可以采用连续分段的方法,但一般要采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性帧移帧长的比值一般取为01/2帧长的选择:帧长为200,帧移100Page 8 3.3 语音信号提取端点检测
4、参数常用参数为短时能量及常用参数为短时能量及短时过零率,方法为双短时过零率,方法为双门限法门限法本次课题仅对声音信号进行研究,本次课题仅对声音信号进行研究,对端点检测精度要求不高,仅用对端点检测精度要求不高,仅用短时能量进行端点检测短时能量进行端点检测端点检测过后,语音信号端点检测过后,语音信号需大于短时能量的某一门需大于短时能量的某一门限方能进行提取限方能进行提取选取无声段的选取无声段的语音信号进行语音信号进行短时能量统计,短时能量统计,选取合适的门选取合适的门限值。门限值限值。门限值最后为最后为0.010.01。Page 9Page 10 语音提取算法流程Page 11 3.4 时域区分方
5、案选定n时域区分通常依靠声音的语音学规律和特征n从已有的研究成果看鼾声呼气段和吸气段通常持续3s。一般的鼾声检测若只检测到吸气段,吸气段通常持续2s。n根据此规律确定鼾声和说话声的区分特征Page 12 3.5 具体方案设计n 完成连续语音提取n 单一连续语音时长介于1-2.5s为鼾声n 三个具体判定参数的选取 第一个为鼾声和说话声的平均时长,记为average,定义公式为:第二个为鼾声和说话声持续时间处于1s-2s之间的声音与总时长的比率,记为cm,定义公式为:第三个为鼾声和说话声持续时间处于 1s-2s的连续帧个数占总帧数的比率,记为cm1,定义公式为:nusumtav sumttcm n
展开阅读全文