数字语音处理复习题分析(DOC 13页).doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字语音处理复习题分析(DOC 13页).doc》由用户(2023DOC)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字语音处理复习题分析DOC 13页 数字 语音 处理 复习题 分析 DOC 13
- 资源描述:
-
1、第一章 绪论1.语音信号处理是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性的学科。p1d32.语音信号处理的应用技术列举:语音编码、语音识别、语音合成、说话人识别和语种辨识、语音转换和语音隐藏(语音信息伪装、语音数字水印技术)、语音增强等p4d33.当前语音信号处理应用的3个主流技术:矢量量化技术、隐马尔可夫模型技术、人工神经网络技术。p4d3第二章 语音信号处理基础知识1.语音是组成语言的声音,是声音(Acoustic)和语言(Language)的组合体。p5d22.语音的基本声学特性包括音色,音调,音强、音长。p7d2 音色:也叫音质,是一种声音区别于另一种声音的基本特征
2、。 音调:是指声音的高低,它取决于声波的频率。 音强:声音的强弱,它由声波的振动幅度决定。 音长:声音的长短,它取决于发音时间的长短。3. 说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。p7d34.任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。p7d38.当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过,这种音称为元音。p7d39.呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不
3、能畅通,而克服发音器官的这种阻碍而产生的音素称为辅音。p7d37.发辅音时由声带是否振动引起浊音和清音的区别,声带振动的是浊音,声带不振动的是清音。p7d38.元音构成音节的主干(因为无论从长度还是能量看,元音在音节中都占主要部分。)p7d39.元音的一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。p7d5 16.人类的声道和鼻道可以看作是非均匀截面的声道管,声道管的谐振频率称为共振峰频率(共振峰)。p7d510.汉语音节一般由声母、韵母和声调三部分
4、组成。汉语普通话中有6000多个常用字,每个汉字是一个音节。p10d610. 发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为基音周期(pitch),其倒数成为基音频率。11.汉语是一种声调语言,声调的变化就是浊音基音周期(或基音频率)的变化。p14d513. 无论是单音节语音还是连续语音,其中浊音段的基因频率是随时间而变化的,基因频率的不同轨迹成为声调。p9d1114. 当两个响度不同的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象成为掩蔽效应。15.语音信号的生成模型可由激励模型、声道模型和辐射模
5、型三个子模型构成,三者是串联(串联/并联)的关系。p21-2616.语音信号激励模型一般分为浊音激励和清音激励,发浊音时激励模型为脉冲波。p21d617.语音信号激励模型一般分为浊音激励和清音激励,发清音时激励信号通常被模拟为随机白噪声。p22d216.语音信号生成模型的辐射模型是一阶类高通滤波器。 p25d217.设截取的一段语音共有160个样本,而采样频率为8kHz,则该段语音持续时间为20ms。18.设采样频率为8kHz,则25ms长的语音共有200个采样值。18.研究语音的时频分析特性所采用的与时序相关的傅立叶分析的显示图形称为语谱图(Sonogram,或者Spectrogram)p2
6、9d119.语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。p29d120.传输函数形式为的共振峰模型为(2)数学模型;1.全零点;2.全极点;3.极零点;4.以上都不是;21.传输函数形式为的共振峰模型在结构上为(1 )模型;1.级联型2.并联型;3.混合型;4.以上都不是;22.传输函数形式为的共振峰模型为(3)数学模型;1.全零点;2.全极点;3.极零点;4.以上都不是;23.传输函数形式为的共振峰模型在结构上为(2)模型;1.级联型2.并联型;3.混合型;4.以上都不是;24.简述语音产
7、生过程的三个模型:25.基音频率、共振峰、语谱图的概念,会从语音波形中识别基音周期与共振峰频率。 发浊音时,气流通过声门时使声带发生振动,产生准周期激励脉冲串,这个脉冲串的周期就称为基音周期(pitch),其倒数成为基音频率。一般来说,男性说话的基音频率大致分布在50-200Hz范围内,女性和小孩的基因频率在200-450Hz之间。 人类的声道和鼻道可以看作是非均匀截面的声道管,声道管的谐振频率成为共振峰频率,简称共振峰。共振峰由低到高依次为第一共振峰、第二共振峰、第三共振峰、。,相应的频率用F1、F2、F3。表示。一般浊音中可以辨识的共振峰有5个,其中前三个对于区别不同语音至关重要。 语谱图
8、描述了语音信号随时间而变化的频谱特性。纵轴对应于频率、横轴对应于时间,图像的黑白度对应于信号的能量。26.汉语中的四种声调与基音频率的关系是什么? 无论是单音节语音还是连续语音,其中浊音段的基因频率是随时间而变化的,基因频率的不同轨迹成为声调。29.音调:音调是听觉分辨声音高低时,用于描述这种感受的一种特性。音调与声音的频率并不成正比,还与声音的强度及波形有关。描述音调的单位是美(mel)。一个高于听阈40dB、频率为1KHz的纯音所产生的音调定位1000mel,如果一个纯音听起来比1000mel的声音调子高一倍,则其音调为2000mel。音调与频率的关系近似表示为:27.掩蔽效应:当两个响度
9、不同的声音作用于人耳时,响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象成为掩蔽效应。第三章 语音信号分析21.语音信号分析采用短时分析技术。p32d220. 语音信号分析,根据所分析出的参数的性质的不同可以分为:时域分析、频域分析、倒频域分析、线性预测分析等。根据分析方法的不同,分为模型分析方法和非模型分析方法两种。p32d322.由于辐射模型的影响,语音信号高频部分衰减较大,所以在预处理中需采用预加重技术,即提升高频部分,使信号的频谱变得平坦。23.不论是分析怎么样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同
10、的短时分析技术必须预先进行,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等23.语音信号加窗、分帧常用的窗函数有矩形窗、汉明窗等(列举两个)。25.对于频率分布为03400Hz的语音信号,最低无失真采样频率应为6800Hz25.若信号波形的变化足够大,或量化间隔足够小时,以下有关量化噪声描述错误的是(4)p33d21.是平稳的白噪声过程2.量化噪声与输入信号不相关3.量化噪声在量化间隔内均匀分布,即具有等概率密度分布4.是服从高斯分布的随机过程26.以下那种分析不属于语音信号时域分析?(4)1.短时过零率分析;2.短时相关分析;3.短时平均幅度差函数;4.同态分析;短时能量的主要
11、用途不包括以下那一项(4)p38d51.可以区分浊音段和清音段;2.可以用来查找声母和韵母的分界;3.可以用来查找无声和有声的分界;4.可以区分高频和低频分量;24.采用自相关函数法对基音周期进行估计时,先用60900Hz的带通滤波器对语音信号进行滤波,以下描述错误的是(4)p71d21.可减少共振峰的影响;2.可抑制50Hz的电源干扰;3.可保留基音频率的一、二次谐波;4.为了防止8kHz采样时发生混叠干扰;定义语音信号的短时自相关函数为:,则以下表述错误的是(2):p40d3(1) 如果是周期的,则是同周期的周期函数;(2) 是奇函数;(3) 7.设序列x(n)的短时能量定义为:其中窗函数
展开阅读全文