第4章-多媒体硬件基础1课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第4章-多媒体硬件基础1课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 硬件 基础 课件
- 资源描述:
-
1、回顾与补充:回顾与补充:音频信号的数字化及压缩音频信号的数字化及压缩技术技术4.0.1 4.0.1 模拟音频的数字化过程模拟音频的数字化过程 数字化的声音易于用计算机软件处理,现在几乎所有的专数字化的声音易于用计算机软件处理,现在几乎所有的专业化声音录制、编辑器都是数字方式。对模拟音频数字化过程业化声音录制、编辑器都是数字方式。对模拟音频数字化过程涉及到涉及到音频的采样音频的采样、量化量化和和编码编码。采样和量化的过程可由采样和量化的过程可由A/DA/D转换器实现转换器实现。A/DA/D转换器以固定的转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化频率去采样,即每个周期测量
2、和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。文件。模拟信号的数字化过程 100101100011101 信息论的奠基者香农(信息论的奠基者香农(ShannonShannon)指出:)指出:在一定条件下,用在一定条件下,用离散的序列可以完全代表一个连续函数离散的序列可以完全代表一个连续函数,这是采样定理的基本,这是采样定理的基本内容。内容。为实现为实现A/DA/D转换,需要转换,需要把模拟音频
3、信号波形进行分割,这种把模拟音频信号波形进行分割,这种方法称为采样方法称为采样(Sampling)(Sampling)。采样的过程是每隔一个时间间隔在。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值模拟声音的波形上取一个幅度值,把时间上的连续信号变成时,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。率。采样频率是指计算机每秒钟采集多少个声音样本。1.1.采样采样 采样频率与声音频率之间有一定的关系,根据奈奎斯特采样频率与声音频率之间有一定的关系,根据
4、奈奎斯特(NyquistNyquist)理论,)理论,只有采样频率高于声音信号最高频率的两只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。倍时,才能把数字信号表示的声音还原成为原来的声音。2f2ff fs s 采样只解决了音频波形信号在采样只解决了音频波形信号在时间坐标时间坐标(即横轴即横轴)上把一个上把一个波形切成若干个等分的数字化问题,但是还需要用某种数字化波形切成若干个等分的数字化问题,但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。我们把响音量的高低。我
5、们把对声波波形幅度的数字化表示称之为对声波波形幅度的数字化表示称之为“量化量化”。量化的过程是先将采样后的信号按整个声波的幅度划分成有量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢相同的量化值。如何分割采样信号的幅度呢?我们还是采取二进我们还是采取二进制的方式,以位制的方式,以位(bit)或或16位位(bit)的方式来划分纵轴。也就是说的方式来划分纵轴。也就是说在一个以在一个以8位为记录模式的音效中,其纵轴将会被划分为位为记录模式的音效中,其纵
6、轴将会被划分为8个量个量化等级,用以记录其幅度大小。化等级,用以记录其幅度大小。2.量化量化 以下图所示的原始模拟波形为例进行采样和量化。假设采样以下图所示的原始模拟波形为例进行采样和量化。假设采样频率为频率为1000次次/秒,即每秒,即每1/1000秒秒A/D转换器采样一次,其幅度被转换器采样一次,其幅度被划分成划分成0到到9共共10个量化等级,并将其采样的幅度值取最接近个量化等级,并将其采样的幅度值取最接近0 9之间的一个数来表示,如下图所示。图中每个正方形表示一次之间的一个数来表示,如下图所示。图中每个正方形表示一次采样。采样。D/A转换器从上图得到的数值中重构原来信号时,得到下转换器从
7、上图得到的数值中重构原来信号时,得到下图中蓝色图中蓝色(直线段直线段)线段所示的波形。从图中可以看出,蓝色线线段所示的波形。从图中可以看出,蓝色线与原波形与原波形(红色线红色线)相比,其波形的细节部分丢失了很多。这意相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。味着重构后的信号波形有较大的失真。失真在采样过程中是不可避免的,如何减少失真呢?可以直失真在采样过程中是不可避免的,如何减少失真呢?可以直观地看出,我们可以把上图中的波形划分成更为细小的区间,即观地看出,我们可以把上图中的波形划分成更为细小的区间,即采用更高的采样频率。同时,增加量化精度,以得到更高的量化采用更
8、高的采样频率。同时,增加量化精度,以得到更高的量化等级,即可减少失真的程度。在下图(左)中,采样率和量化等等级,即可减少失真的程度。在下图(左)中,采样率和量化等级均提高了一倍,分别为级均提高了一倍,分别为2000次次/秒和秒和20个量化等级。在下图(右)个量化等级。在下图(右)中,采样率和量化等级再提高了一倍,分别达到中,采样率和量化等级再提高了一倍,分别达到4000次次/秒和秒和40个个量化等级。从图中可以看出,当用量化等级。从图中可以看出,当用D/A转换器重构原来信号时转换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。(图中的轮廓线),信号的失真明显减少,信号
9、质量得到了提高。3.3.编码编码 模拟信号量经过采样和量化以后,形成一系列的离散信模拟信号量经过采样和量化以后,形成一系列的离散信号号脉冲数字信号。这种脉冲数字信号可以已一定的方式进脉冲数字信号。这种脉冲数字信号可以已一定的方式进行编码,形成计算机内部运行的数据。所谓行编码,形成计算机内部运行的数据。所谓编码,就是按照一编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据用的数据中加入一些用于纠错、同步和控制的数据。在数据回。在数据回放时,可以根据所记录的纠错数据判别读出的声音数
10、据是否有放时,可以根据所记录的纠错数据判别读出的声音数据是否有错,如在一定范围内有错,可加以纠正。错,如在一定范围内有错,可加以纠正。编码的形式比较多,常用的编码方式是编码的形式比较多,常用的编码方式是PCM脉冲调制。脉冲调制。脉冲编码调制(脉冲编码调制(PCM)是把模拟信号变换为数字信号的一种调)是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时域和振幅上都离制方式,即把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。散的量,然后将其转化为代码形式传输或存储。4.0.2 音频信号压缩技术音频信号压缩技术 音频信号压缩编码的主要依据是
11、人耳的听觉特性,主音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:要有两点:1.人的听觉系统中存在一个听觉阈值电平,低于这个人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到电平的声音信号人耳听不到.2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之间的关系存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关与其相对频率的大小有关.声音编码算法就是通过这些特性来去掉更多的冗余声音编码算法就是通过这些特性来去掉更多的冗余数据,来达到压缩数据的目的。数据,来达到压缩数据的目
12、的。(一)(一)脉冲编码调制脉冲编码调制 1编码的原理编码的原理 它的原理框图下图所示它的原理框图下图所示 模拟信号数字化一般有三个步骤:模拟信号数字化一般有三个步骤:第一步是采样第一步是采样,就是每隔一段时间间隔读一次声音的幅度;就是每隔一段时间间隔读一次声音的幅度;第二步第二步是量化是量化,就是把采样得到的声音信号幅度转换成数,就是把采样得到的声音信号幅度转换成数字值。但那时并没有涉及如何进行量化。量化有好字值。但那时并没有涉及如何进行量化。量化有好几种方法,但可归纳成两类:一类称为几种方法,但可归纳成两类:一类称为均匀量化均匀量化,另一类称为另一类称为非均匀量化非均匀量化。采用的量化方法
13、不同,量。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法;种压缩数据的方法;第三步是编码第三步是编码,就是按一定格,就是按一定格式记录采样和量化后的数据。式记录采样和量化后的数据。2均匀量化均匀量化 采用相同的采用相同的“等分尺等分尺”来度量采样得到的幅度,也称为线来度量采样得到的幅度,也称为线性量化,如图性量化,如图3-43-4所示。量化后的样本值所示。量化后的样本值Y Y和原始值和原始值X X的差的差 E=Y-XE=Y-X称为量化误差或量化噪声。称为量化误差或量化噪声。3非均匀量化非均匀量化 对输入信号进行量化
14、时,大的输入信号采用大的量化间隔,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图小的输入信号采用小的量化间隔,如图3-5所示。一个一个CDDADA采用脉冲编码调制采用脉冲编码调制PCM编码的实例编码的实例 首先用一组脉冲采样时钟信号与输入的模拟音频信首先用一组脉冲采样时钟信号与输入的模拟音频信号相乘,相乘的结果即输入信号在时间轴上的数号相乘,相乘的结果即输入信号在时间轴上的数字化。然后对采样以后的信号幅值进行量化。最字化。然后对采样以后的信号幅值进行量化。最简单的量化方法是均衡量化,这个量化的过程由简单的量化方法是均衡量化,这个量化的过程由量化器来完成。
15、对经量化器量化器来完成。对经量化器A/DA/D变换后的信号再进变换后的信号再进行编码,即把量化的信号电平转换成二进制码组,行编码,即把量化的信号电平转换成二进制码组,就得到了离散的二进制输出数据序列就得到了离散的二进制输出数据序列x(n)x(n),n n表示表示量化的时间序列,量化的时间序列,x(n)x(n)的值就是的值就是n n时刻量化后的幅时刻量化后的幅值,以二进制的形式表示和记录。值,以二进制的形式表示和记录。(二)(二)增量调制(增量调制(DMDM调制)调制)它是一种预测编码技术,是它是一种预测编码技术,是PCMPCM编码的一种变形。编码的一种变形。DMDM是是对实际的采样信号与预测的
16、采样信号之差的极性进行编码,对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成将极性变成“0”0”和和“1”1”这两种可能的取值之一。如果实际这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为的采样信号与预测的采样信号之差的极性为“正正”,则用,则用“1”1”表示;相反则用表示;相反则用“0”0”表示,或者相反。表示,或者相反。图3-7 DM波形示意图 从上图中可以看到,在开始阶段增量调制器的输出从上图中可以看到,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象称为不能保持跟踪输入信号的快速变化,这种现象称为增量调制器的增量调制器的“斜率过载斜率
17、过载”(slope overload)(slope overload)。在输入信号缓慢变化部分,即输入信号与预测信号在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出出现随机的差值接近零的区域,增量调制器的输出出现随机交变的交变的“0”和和“1”。这种现象称为增量调制器的粒。这种现象称为增量调制器的粒状噪声状噪声(granular noise),这种噪声是不可能消除,这种噪声是不可能消除的。的。在输入信号变化快的区域,斜率过载是关心的焦点,在输入信号变化快的区域,斜率过载是关心的焦点,而在输入信号变化慢的区域,关心的焦点是粒状噪而在输入信号变化慢的区域,关心的焦点
18、是粒状噪声。声。第第4章章 多媒体硬件基础多媒体硬件基础本章内容本章内容数字音频处理接口数字音频处理接口数字视频处理接口数字视频处理接口多媒体输入多媒体输入/输出设备输出设备多媒体存储技术多媒体存储技术4.1 数字音频处理接口数字音频处理接口一、声卡的功能与工作原理(一、声卡的功能与工作原理(P68)1.声卡的功能声卡的功能(数字化声音数字化声音,合成音乐合成音乐,CD音频音频)(1)播放数字音乐)播放数字音乐(2)录音)录音(3)语音通信)语音通信(全双工全双工)(4)实时的效果器)实时的效果器(5)接口卡)接口卡(SB1394)(6)音频解码)音频解码(7)合成器)合成器(波表波表)2.声
19、卡的基本原理声卡的基本原理(1)结构)结构 模模/数转换电路数转换电路 数数/模转换电路模转换电路(2)组成)组成 MIDI输入输入/输出电路输出电路 MIDI合成器芯片合成器芯片 模模/数转换器数转换器 压缩芯片压缩芯片 语音合成器语音合成器 语音识别电路语音识别电路 输出电路输出电路3.声卡的类型声卡的类型(1)板卡式)板卡式(2)集成式)集成式(3)外置式声卡)外置式声卡二、音乐合成和二、音乐合成和MIDI接口规范接口规范(P70)1.音乐合成与音乐合成与MIDI目前,声卡的音乐合成主要有两种方法:目前,声卡的音乐合成主要有两种方法:一种是常用的调频(一种是常用的调频(FM)合成法;另一
20、种就)合成法;另一种就是波表(是波表(Wave Table)合成法。)合成法。衡量声卡的音乐合成器性能好坏的参数:衡量声卡的音乐合成器性能好坏的参数:(1)音色数目)音色数目(2)发音数)发音数(3)音乐的兼容性)音乐的兼容性2.MIDI术语(见表术语(见表4.1)3.MIDI接口接口(1)MIDI In(输入口)(输入口)(2)MIDI Out(输出口)(输出口)(3)MIDI Thru(转发口)(转发口)4.MIDI技术规范技术规范MIDI规定合成器、音序器、微机和鼓乐规定合成器、音序器、微机和鼓乐等能通过一个标准的接口连接。等能通过一个标准的接口连接。二、音乐合成和二、音乐合成和MIDI
21、接口规范接口规范三、语音合成语音合成(P73)1.概述概述计算机话语输出按其实现功能可分为:计算机话语输出按其实现功能可分为:1)有限词汇的计算机语音输出有限词汇的计算机语音输出(报时、报站报时、报站)2)基于语音合成技术的文字基于语音合成技术的文字语音转换语音转换(TTS)2.合成方法合成方法1)发音器官参数语音合成发音器官参数语音合成2)声道模型参数语音合成声道模型参数语音合成3)波形编辑语音合成技术波形编辑语音合成技术PSOLA(基音同步叠加基音同步叠加)算法(P74)(1)对原始波形进行分析,产生非参)对原始波形进行分析,产生非参数的中间表示;数的中间表示;(2)对中间表示进行修改;)
22、对中间表示进行修改;(3)将修改过的中间表示重新合成为)将修改过的中间表示重新合成为语音信号。语音信号。3.语音基元数据库的构建语音基元数据库的构建(1)基元的选择)基元的选择选择音节选择音节选择双音素和三音素选择双音素和三音素(2)语音数据的存储形式)语音数据的存储形式波形存储方式存储波形存储方式存储参数存储方式存储参数存储方式存储4.韵律模拟韵律模拟1)自然语言中的韵律特征自然语言中的韵律特征2)韵律合成及方法)韵律合成及方法3)韵律模拟的问题)韵律模拟的问题4.1.4 音频编码标准音频编码标准(一)(一)CCITT G系列声音压缩标准系列声音压缩标准CCITTCCITT和和ISOISO先
23、后提出了一系列有关语音数据编译码标先后提出了一系列有关语音数据编译码标准准,下面简要介绍几种音频编码技术标准。下面简要介绍几种音频编码技术标准。1电话质量的音频压缩编码技术标准电话质量的音频压缩编码技术标准信号频率规定在信号频率规定在300Hz300Hz3.4kHz3.4kHz,采用标准的脉冲编,采用标准的脉冲编码调制码调制(PCM)(PCM),当采样频率为,当采样频率为8kHz8kHz,进行,进行8bit8bit量化量化时,所得数据速率为时,所得数据速率为64kb/s64kb/s,即一个数字电话。,即一个数字电话。1972年年CCITT为电话质量和语音压缩制定了为电话质量和语音压缩制定了PC
24、M标准标准G.711,其速率为,其速率为64Kbs,使用非线性量化,使用非线性量化技术,主要用于公共电话网中。技术,主要用于公共电话网中。2 2调幅广播质量的音频压缩编码技术标准调幅广播质量的音频压缩编码技术标准 频率在频率在50Hz50Hz一一7kHz7kHz范围。范围。G.722G.722标准是采用标准是采用16kHz16kHz采样,采样,14bit14bit量化,信号数据速率为量化,信号数据速率为224kbit224kbits s,采用子带编码方法,将输入音频信号经滤波器分采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行成高子带和低子带两个部分,分别进行ADP
25、CMADPCM编编码,再混合形成输出码流,码,再混合形成输出码流,224kbit224kbits s可以被压可以被压缩成缩成64kbit64kbits s,最后进行数据插入,最后进行数据插入(最高插入速最高插入速率达率达16kbit16kbits)s),因此利用,因此利用G.722G.722标准可以在窄标准可以在窄带综合服务数据网带综合服务数据网N-ISDNN-ISDN中的一个中的一个B B信道上传送信道上传送调幅广播质量的音频信号调幅广播质量的音频信号。3 3高保真度立体声音频压缩编码技术标准高保真度立体声音频压缩编码技术标准 高保真立体声音频信号频率范围是高保真立体声音频信号频率范围是50
展开阅读全文