音频处理技术课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《音频处理技术课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 处理 技术 课件
- 资源描述:
-
1、上海建桥学院信息技术系1 1第第4章章 多媒体音频处理技术多媒体音频处理技术4.1 音频信号及其概念音频信号及其概念4.2 模拟音频的数字化过程模拟音频的数字化过程4.3 声卡的组成和功能声卡的组成和功能4.4 音频文件的格式与处理软件音频文件的格式与处理软件4.5 乐器数字接口乐器数字接口-MIDI4.6 数字音频的应用数字音频的应用2022-12-4上海建桥学院信息技术系2 22022-12-4上海建桥学院信息技术系3 34.1.1 声音处理技术历史回顾声音处理技术历史回顾 记录:记录:19世纪,爱迪生,留声机。世纪,爱迪生,留声机。电声技术:电声技术:研究可听声频率范围内声音的产研究可听
2、声频率范围内声音的产生、传播、存储、重放和接收的技术。依靠电来生、传播、存储、重放和接收的技术。依靠电来记录并播放声音,通过电压产生模拟声波变化的记录并播放声音,通过电压产生模拟声波变化的电流信号是模拟信号。电流信号是模拟信号。随着计算机技术和存储设备的发展,数字化随着计算机技术和存储设备的发展,数字化音频处理技术也得到了发展。音频处理技术也得到了发展。2022-12-4上海建桥学院信息技术系4 4图图4-24-2用磁带记录声音的录音机用磁带记录声音的录音机 2022-12-4上海建桥学院信息技术系5 54.1.2 声音信号的形式声音信号的形式 任何声音都是物体振动产生的现象,其在介任何声音都
3、是物体振动产生的现象,其在介质中的传播称为声波。质中的传播称为声波。声源所引起的空气压力变声源所引起的空气压力变化,被耳朵的耳膜所检测,然后产生电信号刺激化,被耳朵的耳膜所检测,然后产生电信号刺激大脑的听觉神经,从而使人们能感觉到声音的存大脑的听觉神经,从而使人们能感觉到声音的存在。在。2022-12-4上海建桥学院信息技术系6 64.1.2 声音信号的形式声音信号的形式 语音信号语音信号:语言的物质载体,具有复杂的语语言的物质载体,具有复杂的语法和语义,难于识别。法和语义,难于识别。非语音信号非语音信号:音乐,自然界的声音,信息量:音乐,自然界的声音,信息量低,识别简单。低,识别简单。202
4、2-12-4上海建桥学院信息技术系7 7图图4-4 4-4 在自然界,声波与水波一样都是一种振动波在自然界,声波与水波一样都是一种振动波2022-12-4上海建桥学院信息技术系8 8 图图4-5 4-5 用声音录制软件记录的英文单词用声音录制软件记录的英文单词”Hello”Hello”语音的实际波形语音的实际波形2022-12-4上海建桥学院信息技术系9 94.1.3 模拟音频信号的物理特征模拟音频信号的物理特征 频率:体现音调的高低,单位频率:体现音调的高低,单位Hz 幅度:体现声音的强弱,单位幅度:体现声音的强弱,单位dB 语音信号频率范围:语音信号频率范围:300Hz3000Hz 可听频
5、率带宽(音频):可听频率带宽(音频):20Hz20kHz2022-12-4上海建桥学院信息技术系10102022-12-4上海建桥学院信息技术系1111振幅周期频率图图4-6 4-6 声波的频率、周期与振幅声波的频率、周期与振幅2022-12-4上海建桥学院信息技术系1212女性语音女性语音电话语音电话语音调幅广播调幅广播(AM)调频广播调频广播(FM)高级音响高级音响男性语音男性语音2022-12-4上海建桥学院信息技术系1313声音质量分级与带宽声音质量分级与带宽电话调幅广播调频广播CD-DA 10 20 502003.4K7K15K频率(Hz)图图4-8 4-8 四级声音质量的频率范围四
6、级声音质量的频率范围 2022-12-4上海建桥学院信息技术系1414声音的质量与声音的频率范围有关。声音的质量与声音的频率范围有关。一般说来,频率范围越宽声音的质量就越高。一般说来,频率范围越宽声音的质量就越高。对语音而言,常用对语音而言,常用可懂度、清晰度、自然度可懂度、清晰度、自然度来衡来衡量;而对音乐来说,量;而对音乐来说,保真度、空间感、音响效果保真度、空间感、音响效果都是重要的指标都是重要的指标2022-12-4上海建桥学院信息技术系1515第第4章章 多媒体音频处理技术多媒体音频处理技术4.1 音频信号及其概念音频信号及其概念4.2 模拟音频的数字化过程模拟音频的数字化过程4.3
7、 声卡的组成和功能声卡的组成和功能4.4 音频文件的格式与处理软件音频文件的格式与处理软件4.5 乐器数字接口乐器数字接口-MIDI4.6 数字音频的应用数字音频的应用2022-12-4上海建桥学院信息技术系16162022-12-4上海建桥学院信息技术系1717借助于借助于A/DA/D或或D/AD/A转换器,模拟信号和数字信号可以互相转换转换器,模拟信号和数字信号可以互相转换2022-12-4上海建桥学院信息技术系18182022-12-4上海建桥学院信息技术系19194.2.1采样采样 为实现为实现A/D转换,需要把模拟音频信号波形进行分转换,需要把模拟音频信号波形进行分 割(每隔一定的时
8、间间隔测一次模拟音频的值割(每隔一定的时间间隔测一次模拟音频的值(如电压如电压)),),以转变成数字信号,这种方法称为采样以转变成数字信号,这种方法称为采样(Sampling)。每。每秒钟采样的次数称为秒钟采样的次数称为采样率采样率。数字音频是离散的,而模拟音频是连续的,数字音频数字音频是离散的,而模拟音频是连续的,数字音频质量的好坏与采样率密切相关。数字音频信息可以被计算质量的好坏与采样率密切相关。数字音频信息可以被计算机存储、处理和播放。机存储、处理和播放。Nyquist采样定理:只有采样频率高于声音信号最高采样定理:只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原为
9、原来的频率的两倍时,才能把数字信号表示的声音还原为原来的声音。声音。2022-12-4上海建桥学院信息技术系2020图图4-9 4-9 声音的采样和量化示意图声音的采样和量化示意图2022-12-4上海建桥学院信息技术系21214.2.2 量化量化用某种数字化的方法来反映某一瞬间声波幅度的电用某种数字化的方法来反映某一瞬间声波幅度的电压值的大小称为量化。压值的大小称为量化。采样后的信号按照整个声波的幅度(幅度轴采样后的信号按照整个声波的幅度(幅度轴)划分)划分称有限个区段的集合,把落入某个区段内的样值归为一称有限个区段的集合,把落入某个区段内的样值归为一类,并赋予形同的量化值。采用二进制,以类
10、,并赋予形同的量化值。采用二进制,以16位或位或256位等的方式来进行。位等的方式来进行。2022-12-4上海建桥学院信息技术系2222输入输出输入输出均匀量化均匀量化非均匀量化非均匀量化2022-12-4上海建桥学院信息技术系2323数字音频等级数字音频等级信号类型信号类型频率范围频率范围Hz采样频率采样频率KHz 量化精度量化精度(位位)电话语音电话语音200340088宽带音频宽带音频5070001616调频广播调频广播2015k37.816CD-DA2022k44.116SACD2-100k2822.4 1(信息流信息流)DVD-AUDIO100k9619224HDTA48,96,3
11、8424,322022-12-4上海建桥学院信息技术系24242022-12-4上海建桥学院信息技术系2525数据量数据量=采样频率采样频率(量化位数(量化位数/8)声道数声道数声音持续时间声音持续时间 对于调频广播级立体声,采样频率为对于调频广播级立体声,采样频率为44.1kHz,量化等级为,量化等级为16位(即位(即2字节)声道形式为双声道,则转换后每秒以千字节为字节)声道形式为双声道,则转换后每秒以千字节为单位的数据量为:单位的数据量为:44 100(Hz)(16/8)()(B)2=176 400B/s172kB/s 用用44.1kHz的采样频率对声波进行采样,每个采样点的量化位的采样频
12、率对声波进行采样,每个采样点的量化位数选用数选用16位,则录制位,则录制3分钟的立体声节目,其波形文件所需的分钟的立体声节目,其波形文件所需的存储容量为:存储容量为:44 100(Hz)(16/8)()(B)2360=31 752 000B/s 31 007.8kB/s 30.28MB/s2022-12-4上海建桥学院信息技术系2626 2022-12-4上海建桥学院信息技术系27274.2.3 声音采样与量化过程示例声音采样与量化过程示例2022-12-4上海建桥学院信息技术系2828图图4-10 4-10 采样频率为采样频率为1000Hz1000Hz,1010个量化等级的波形个量化等级的波
13、形2022-12-4上海建桥学院信息技术系2929图图4-11 4-11 经过经过D/AD/A转换器得到的信号波形转换器得到的信号波形(直线段的波形直线段的波形)有较大的失真有较大的失真2022-12-4上海建桥学院信息技术系3030图图4-12 4-12 采样率为采样率为2000Hz2000Hz,量化等级为,量化等级为2020的采样量化过程的采样量化过程2022-12-4上海建桥学院信息技术系3131图图4-13 4-13 采样率为采样率为4000Hz4000Hz,量化等级为,量化等级为4040的采样量化过程的采样量化过程2022-12-4上海建桥学院信息技术系32324.2.4 压缩编码压
14、缩编码 依据:依据:声音信息中存在着多种冗余声音信息中存在着多种冗余 听觉器官的不敏感性听觉器官的不敏感性 采样的标本中存在着相关性采样的标本中存在着相关性 压缩算法通常应能满足下列需求:压缩算法通常应能满足下列需求:压缩倍数高,压缩后的数据率低;压缩倍数高,压缩后的数据率低;解码后的信号失真小,质量高;解码后的信号失真小,质量高;算法简单,执行速度快,延迟时间短;算法简单,执行速度快,延迟时间短;编码器、解码器的成本低。编码器、解码器的成本低。2022-12-4上海建桥学院信息技术系3333压缩方法(压缩方法(compression method)有损压缩有损压缩 无损压缩无损压缩编码选择(
15、编码选择(code selection)机常用的声卡上有自适应差分脉冲码调制方机常用的声卡上有自适应差分脉冲码调制方案案,律律a 律等,律等,format(structure)2022-12-4上海建桥学院信息技术系3434音频信息的压缩技术音频信息的压缩技术 HuffmanHuffman 编码编码无损无损压缩压缩 行程编码行程编码 全频带编码:全频带编码:PCMPCM;DPCMDPCM;ADPCMADPCM 子带编码子带编码 :自适应变换编码自适应变换编码ATCATC;心理学模型;心理学模型波形编波形编码码 矢量量化编码矢量量化编码参数编参数编码码 线性预测线性预测 LPCLPC 矢量和激励
16、线性预测矢量和激励线性预测 VSELPVSELP 多脉冲线性预测多脉冲线性预测 MP-LPCMP-LPC有有 损损 压压 缩缩混合编混合编码码 码本激励线性预测码本激励线性预测 CELPCELP2022-12-4上海建桥学院信息技术系3535输入信号解码器传输/存储编码器输出信号图图4-14 4-14 音频信号处理过程音频信号处理过程2022-12-4上海建桥学院信息技术系3636第第4章章 多媒体音频处理技术多媒体音频处理技术4.1 音频信号及其概念音频信号及其概念4.2 模拟音频的数字化过程模拟音频的数字化过程4.3 声卡的组成和功能声卡的组成和功能4.4 音频文件的格式与处理软件音频文件
17、的格式与处理软件4.5 乐器数字接口乐器数字接口-MIDI4.6 数字音频的应用数字音频的应用2022-12-4上海建桥学院信息技术系37374.3.1 声卡的工作原理声卡的工作原理游戏接口MIDI接口混合信号处理器总线接口和控制器数字声音处理器MIC放大器功率放大器音乐合成器麦克风输入Line输入CD输入扬声器输出PC总线数据总线地址总线控制总线图图4-16 4-16 声卡工作原理框图声卡工作原理框图采用大规模采用大规模集成电路设集成电路设计,将音频计,将音频技术范围的技术范围的各类电路以各类电路以专用芯片的专用芯片的形式集成在形式集成在声卡上,并声卡上,并可直接插入可直接插入计算机的扩计算
18、机的扩展槽中使用。展槽中使用。2022-12-4上海建桥学院信息技术系3838 1主芯片主芯片-数字信号处理器数字信号处理器 声音信息处理、特殊音效过滤与处理、语音识别、声音信息处理、特殊音效过滤与处理、语音识别、实施压缩等等任务。实施压缩等等任务。2混音芯片混音芯片-CODEC 负责调节各声音来源的音量、混音与调整录放音的音量大小 图图4-18 Sound Blaster PCI644-18 Sound Blaster PCI64声卡的混音器设置界面声卡的混音器设置界面2022-12-4上海建桥学院信息技术系3939 3.合成器合成器 负责负责 MIDI乐曲的合成可以及时创造各种音乐乐曲的合
19、成可以及时创造各种音乐 MIDI合成器有两种:频率调制合成器合成器有两种:频率调制合成器(FM合成器合成器)、波形表波形表(Wave table合成器合成器)。4.总线接口和控制器总线接口和控制器 总线接口和控制器由数据总线双向驱动器、总线接口总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和控制逻辑、总线中断逻辑和DMA控制逻辑组成。控制逻辑组成。5.外部输入输出口外部输入输出口 声卡外部输入输出口均为声卡外部输入输出口均为3.5mm规格插口规格插口(MIDI/Joystick除外)除外)2022-12-4上海建桥学院信息技术系40402022-12-4上海建桥学院信息技
20、术系41414.3.2 声卡的性能指标声卡的性能指标 1音频技术指标音频技术指标 2MIDI音频音频 3声道数(声道数(Dolby AC-3等)等)图图4-19 5.14-19 5.1声道系统的布局图声道系统的布局图2022-12-4上海建桥学院信息技术系4242 4.多音频流输出多音频流输出 5.I/O设备接口设备接口 6.声卡软件声卡软件 7.总线结构总线结构图图4-20 4-20 支持支持5.15.1声道系统的声卡接口声道系统的声卡接口2022-12-4上海建桥学院信息技术系43432022-12-4上海建桥学院信息技术系44442022-12-4上海建桥学院信息技术系45452022-
21、12-4上海建桥学院信息技术系4646杜比与DTS 1.Dolby Digital Mono:1.Dolby Digital Mono:杜比数字单声道音效杜比数字单声道音效只有单声道的效果只有单声道的效果,并不足以构成立体声并不足以构成立体声,2.Dolby Digital Stereo:2.Dolby Digital Stereo:杜比数字双声道音效杜比数字双声道音效将双声道的立体讯号储存为将双声道的立体讯号储存为AC-3AC-3格式格式,3.Dobly Digital Surround:3.Dobly Digital Surround:杜比数字环绕音效杜比数字环绕音效 4.Dolby Di
22、gital 4.0:4.Dolby Digital 4.0:杜比数字环绕音效杜比数字环绕音效4.04.0 5.Dolby Digital 5.0:5.Dolby Digital 5.0:杜比数字环绕音效杜比数字环绕音效5.05.0 6.Dolby Digital 5.1:6.Dolby Digital 5.1:杜比数字环绕音效杜比数字环绕音效5.15.1以以Dolby DigitalDolby Digital来表示来表示Dolby Digital 5.1,Dolby Digital 5.1,也就是也就是5.15.1声道的声道的 Dolby DigitalDolby Digital或或AC-3.
23、AC-3.7.Dolby digital 7.111.17.Dolby digital 7.111.1等等等等2022-12-4上海建桥学院信息技术系4747杜比与DTSPCM 高音质数字音效高音质数字音效:DVD利用利用PCM格式储存未经压缩格式储存未经压缩的双声道讯号,由于的双声道讯号,由于DVD具有庞大的具有庞大的空间与速度优势空间与速度优势,可以大胆使用更高的取样率与解析度可以大胆使用更高的取样率与解析度,因因此可以提供远高于传统此可以提供远高于传统CD的表现的表现DTS 数字环绕音效数字环绕音效:属于属于5.1声道的环绕效果声道的环绕效果,DTS采用与采用与AC-3不同的压缩技术将环
24、绕音效储存至不同的压缩技术将环绕音效储存至DVD.播放时必须播放时必须采用具有采用具有dts译码能力的系统译码能力的系统.DTS跟跟Dolby Digital 5.1最最大的差别在于两者使用不同的大的差别在于两者使用不同的”算法算法”2022-12-4上海建桥学院信息技术系4848n 4.3.3 声卡的主要功能声卡的主要功能 录制与播放声音录制与播放声音 通过接在声卡上的话筒录制声音,并以文件形式保存在计算机中,随时可打开声音文件进行播放。声音文件的格式可因使用不同的软件而不同。音乐合成音乐合成 利用声卡上的合成器将存储在计算机内存中的MIDI文件合成为音乐乐曲。通过混合器混合和处理多个不同音
展开阅读全文