语音信号处理第八章语音合成课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《语音信号处理第八章语音合成课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 第八 合成 课件
- 资源描述:
-
1、1语音信号处理第8章 语音合成2第8章 语音合成l8.1 概述l8.2 共振峰合成法l8.3 线性预测合成法l8.4 文语转换系统38.1 概述l8.1.1 语音合成的定义l8.1.2 语音合成的应用l8.1.3 语音合成的方法48.1.1 语音合成的定义l语音合成是通过机械的、电子的方法产生人造语音的技术。它的目的是使一些以其他方式表示或存储的信息能转换为清晰可懂的语音,从而让人们能够利用听觉获取这些信息58.1.1 语音合成的定义Intention-To-SpeechConcept-To-SpeechText-To-Speech 按照人类语言功能的不同层次,语音合成也可分为三个层次,即:1
2、.从文字到语音的合成(Text-to-Speech)2.从概念到语音的合成(Concept-to-Speech)3.从意向到语音的合成(Intention-to-Speech)68.1.2 语音合成的应用l传统语音系统的缺陷l需要对信息文本进行录音并保存为声音文件,占用存储空间和工作量大l不能动态反映信息的更新,应用范围有很大局限WAV格式文件所占容量(KB)=(取样频率 X 量化位数 X 声道)X 时间/8,每一分钟WAV格式的音频文件的大小约为10MB 78.1.2 语音合成的应用l语音合成技术的优势l无需对信息文本进行录音,极大地节省了存储空间和减少了工作量l能动态反映信息的变化,应用范
3、围广8几个语音合成应用的实例l查询系统 话费查询、考试结果查询、股票交易查询等9几个语音合成应用的实例l有声词典 单词、例句朗读等l电脑游戏 目前游戏中人物只能说出事先录好的语音。利用语音合成技术可以让人物说出任意语句,同时具有不同说话风格和语气,从而大大加强游戏的趣味性和互动性108.1.3 语音合成的方法l8.1.3.1 波形合成法l8.1.3.2 参数合成法l8.1.3.3 规则合成法118.1.3.1 波形合成法l波形合成法一般分为两种,一种是波形编码合成,另一种是波形编辑合成。波形合成法是一种相对简单的合成技术,通常只能合成有限词汇的语音段。许多专门用途的语音合成器都采用这种方式,如
4、自动报号、报时、报站、报警等128.1.3.1 波形合成法波形合成法波形编码合成波形编辑合成主要步骤:将需要合成的语音的波形进行存储或者进行波形编码压缩后存储,合成重放时再解码组合输出特点:所需存储空间较大,合成的语音词汇量较为有限主要步骤:对自然语言的波形进行编辑拼接后输出。合成时对语音段不做大的修改特点:需要比较大的语音单位(如词组、语句)作为合成基元138.1.3.2 参数合成法l主要步骤:利用语音信号的短时平稳性,提取出每帧语音信号的声学参数,将这些参数编码后组成一个语音参数库输出时,从语音参数库中取出相应的参数,利用合成算法恢复语音主要的合成参数有:控制音强的幅度参数、控制音高的基频
5、参数和控制音色的共振峰参数l共振峰合成和线性预测合成是该类合成技术中的重要方法148.1.3.2 参数合成法l优点所需音库一般较小整个系统能适应的韵律特征范围较大音质适中l缺点算法复杂,参数多压缩比较大时合成的语音不够自然清晰158.1.3.3 规则合成法l主要步骤系统中预先存储音素的声学参数,以及由音素组成音节、音节组成词、词组成句子和控制音调、轻重音等韵律的各种规则给出需要合成的语句后,系统根据相应规则自动将它们转换成语音声波168.1.3.3 规则合成法l特点合成的词汇表不是事先确定可以合成无限词汇的语句17小贴士:语音合成的基本术语1合成单元(Synthesis Unit)l 也称为合
6、成单位,是语音合成系统所处理的最小的语音学基本单位l 按由小到大的顺序排列,语音学中的音素、双音素、半音节、音节、词、短语和句子都可以用作合成单元,合成单元越大,合成语音音质越好,但合成语音的数量及其数码率也越大l 在波形合成中,合成单元较大,多为词、短语或句子l 在参数合成和规则合成中,有些语言(如英语或日语)的合成多采用音素,辅音加元音和元音加辅音等合成单元;有些语言(如汉语)的合成单元多采用音节和声、韵母作合成单元18小贴士:语音合成的基本术语2合成参数(Synthesis Parameters)l 在参数合成和规则合成方式中,控制语音合成器以输出所需语音的一组参数l 合成参数分为两类音
7、色参数(音段参数),常用的有:共振峰频率,线性预测系数和生理发音参数韵律参数(超音段参数),主要有控制音强的幅度参数,控制音高的基频参数,控制音长的时间参数等19小贴士:语音合成的基本术语3合成语音库(Database for Synthesis)l 在语音合成系统中,所有合成单元的编码数据或合成参数数据的集合称为合成语音库l 对于波形合成,语音库中存储的是合成单元的波形编码l 对于参数合成,语音库中存储的是各合成单元逐帧的合成参数l 对于规则合成,语音库中存储的是各合成单元的声学参数和一系列合成规则20PSOLA算法l核心思想:直接对存储于音库的语音运用PSOLA算法进行拼接从而合成完整的语
8、音l主要特点:有别于传统概念中只是将不同的语音单元进行简单拼接,PSOLA系统首先要在大量语音库中,选择最合适的语音单元用于拼接,使合成波形既保持了原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获得很高的清晰度和自然度21选音l对于同一个合成单元,由于语境不同,重音表现不同,其声学特征有很大不同,因此可以建立多样板语音数据库,合成时根据某种规则或模型选择最合适的单元l选音过程中往往采用多种复杂的技术,包括多项统计学上的技术或神经网络技术,如日本ATR推出的多语种语音合成系统,就采用了统计学上的隐马尔可夫模型来进行选音22PSOLA算法l本质上说,PSOLA算法是利用短时
展开阅读全文