《多媒体通信技术》多媒体通信技术练习题参考答案.docx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《多媒体通信技术》多媒体通信技术练习题参考答案.docx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体通信技术 多媒体 通信 技术 练习题 参考答案
- 资源描述:
-
1、第1章 多媒体通信技术概述1. 什么是媒体?根据原CCITT的定义,媒体可划分为那几大类?它们是如何描述的?媒体是指信息传递和存储的最基本的技术和手段,即信息的载体。媒体的英文是Medium,复数是media。根据原CCITT(国际电报电话咨询委员会)的定义,媒体可划分为五大类:(1) 感觉媒体(Perception Medium)感觉媒体是指人类通过其感觉器官,如听觉、视觉、嗅觉、味觉和触觉器官等直接产生感觉(感知信息内容)的一类媒体,这类媒体包括声音、文字、图像、气味和冷、热等。(2) 表示媒体(Representation Medium)表示媒体是指用于数据交换的编码表示,这类媒体包括图
2、像编码、文本编码、声音编码等。其目的是有效地加工、处理、存储和传输感觉媒体。(3) 显示媒体(Presentation Medium)显示媒体是指进行信息输入和输出的媒体。输入媒体包括键盘、鼠标、摄像头、话筒、扫描仪、触摸屏等,输出媒体包括显示屏、打印机和扬声器等。(4) 存储媒体(Storage Medium)存储媒体是指进行信息存储的媒体。这类媒体包括硬盘、光盘、软盘、磁带、ROM、RAM等。(5) 传输媒体(Transmission Medium)传输媒体是指承载信息、将信息进行传输的媒体。这类媒体包括双绞线、同轴电缆、光缆和无线电链路等。2. 如何理解多媒体技术?多媒体技术就是计算机交
3、互式综合处理多媒体信息文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。简而言之,多媒体技术就是计算机综合处理声、文、图等信息的技术,具有集成性、实时性和交互性的特点。多媒体技术最简单的表现形式就是多媒体计算机。3. 简述多媒体通信的体系结构。图1-1为国际电联ITU-TI.211建议为B-ISDN提出的一种适用于多媒体通信的体系结构模式。 图1-1多媒体通信的体系结构多媒体通信体系结构模式主要包括下列五个方面的内容:传输网络:它是体系结构的最底层,包括LAN(局域网)、WAN(广域网)、MAN(城域网)、ISDN、 B-ISDN(ATM)、FDDI(光纤分布数据接口
4、)等高速数据网络。该层为多媒体通信的实现提供了最基本的物理环境。在选用多媒体通信网络时应视具体应用环境或系统开发目标而定, 可选择该层中的某一种网络,也可组合使用不同的网络。 网络服务平台:该层主要提供各类网络服务,使用户能直接使用这些服务内容,而无需知道底层传输网络是怎样提供这些服务的,即网络服务平台的创建使传输网络对用户来说是透明的。 多媒体通信平台:该层主要以不同媒体(正文、图形、图像、语音等)的信息结构为基础,提供其通信支援(如多媒体文本信息处理),并支持各类多媒体应用。 一般应用:该应用层指人们常见的一些多媒体应用,如多媒体文本检索、宽带单向传输、联合编辑以及各种形式的远程协同工作等
5、。 特殊应用:该应用层所支持的应用是指业务性较强的某些多媒体应用,如电子邮购、远程培训、远程维护、远程医疗等。4. 多媒体通信的特征有哪些?多媒体通信系统必须同时兼有多媒体的集成性、计算机的交互性、通信的同步性3个主要特征。5. 论述多媒体通信涉及的各种关键技术。多媒体数据压缩技术、多媒体通信终端技术、多媒体通信网络技术、多媒体信息存储技术、多媒体数据库及其检索技术、多媒体数据的分布式处理技术。6. 试举出一两种多媒体通信系统的具体应用,并从中分析多媒体通信对人类社会的影响。略第2章 数字音频处理技术1. 请分析音频信号的数字化方法及影响因素。音频信号的数字化过程就是将模拟音频信号转换成有限个
6、数字表示的离散序列,即数字音频序列,在这一处理过程中涉及到模拟音频信号的采样、量化和编码。对同一音频信号采用不同的采样、量化和编码方式就可形成多种形式的数字化音频。2. 简要说明参数编码和混合编码基本原理,并进行比较。参数编码又称声源编码,它是通过构造一个人发声的模型,以发声机制的模型作为基础,用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型,在发送端从模拟语音信号中提取各个特征参量并对这些参量进行量化编码,以实现语音信息的数字化。混和编码将波形编码和参数编码结合起来,力图保持波形编码话音的高质量与参数编码的低速率,混合编码信号中既包含若干语音特征参量又包含部分波形编码信息。参数
7、编码的特点是语音编码速率较低,基本上在29.6kbit/s之间。可见其压缩的比特率较低。但是也有其缺点:首先是合成语音质量较差,其次是电路实现的复杂度比较高。混合编码方法就是克服了波形编码和参数编码的弱点,并且很好地结合了上述两种方法的优点。3. 常用的音频压缩编码有哪几种?简要说明各自的特点。非均匀PCM(/A律压扩方法)采用非均匀量化编码能够减少表示采样的位数,从而达到数据压缩的目的。增量调制与自适应增量调制,增量调制也称调制(delta modulation, DM),是一种比较简单且有数据压缩功能的波形编码方法。自适应增量调制是能使DM的量化阶距适应信号变化的要求。自适应差分脉冲编码调
8、制,将自适应量化技术和自适应预测技术结合在一起用于差分脉冲编码调制中,从而实现了自适应差分脉冲编码调制。子带编码,其基本思想是将输入信号分解为若干子频带,然后对各子带分量根据其不同的统计特性采取不同的压缩策略,以降低码率。变换编码是有失真编码的一种重要的编码类型。在变换编码中,原始数据从初始空间或者时间域进行数学变换,使得信号中最重要的部分(例如包含最大能量的最重要的系数)在变换域中易于识别,并目集中出现,可以重点处理;相反使能量较少的部分较分散,可以进行粗处理。矢量量化编码,其基本原理是用码书中与输入矢量最匹配的码字的索引(下标)代替输入矢量进行传输和存储,而解码时只需简单地查表操作。矢量量
9、化的三大关键技术是码书设计、码字搜索和码字(下标)索引分配。感知编码,感知编码基于人耳的听觉特性,通过消除不被感知的冗余信息来实现对音频数据压缩的编码方法。线性预测编码方法为参数编码方式。参数编码的基础是人类语音的生成模型,通过这个模型,提取语音的特征参数,然后对特征参数进行编码传输。4. 说明感知编码的基本原理。感知编码基于人耳的听觉特性,通过消除不被感知的冗余信息来实现对音频数据压缩的编码方法。它基于心理声学模型,利用人的听觉阈值特性和掩蔽效应,通过给不同频率处的信号分量分配以不同量化比特的方法来控制量化噪声,使得噪声能量低于掩蔽阈值,即把压缩带来的失真控制在听阈以下,使人耳觉察不到失真的
10、存在,从而实现更高效率的音频压缩。目前,在高质量音频编码标准中,心理声学模型是一个最为有效的算法模型。在此类编码中,以MPEG音频编码(MPEG layerl, 2, 3和AAC标准)和Dolby Digital的应用最为广泛5. 评估一种语音编码器的性能有哪些方法?编码速率、合成语音质量、编解码延时以及算法复杂度这4个因素是评价一个语音编码算法性能的基本指标,这4个因素之间有着密切的联系,在具体评价某种语音编码算法的优劣时,需要根据具体的实际情况,综合考虑4个因素进行性能评价。6. 分析音频检索技术的应用及特点。音频检索是通过这些自然的听觉特征来检索声音信息。需要研究一种新的技术基于内容的音
11、频检索技术。相对于日益成熟的图像与视频检索,音频检索相对滞后。在20世纪90年代末,基于内容的音频检索才成为多媒体检索技术的研究热点。与传统的信息检索相比,基于内容的音频信息检索有如下特点:l 对音频信息进行深层次地分析、挖掘。不拘泥于信息的外部表层特征,对信息的内容(如对音色、音调、旋律、节奏等)进行分析,以达到更深的检索层次。l 是一种相似性匹配。以相似性作为标准,而不是以绝对的精确匹配作为标准,是一个逐步求精的迭代过程,直到用户获得满意的查询结果为止。l 检索方式直观形象。突破了传统的基于表达式检索的局限,可为用户提供易于理解的可视化检索方式,如:示例查询、更人性化的检索界面。l 是一种
12、交互式检索。通常是按照与用户输入的查询信息相似程度来排列查询结果,往往还需要用户参与,在所给出的查询结果中作出进一步选择,以便获得最终结果。l 数据库的结构复杂、容量大。不仅包括文字等结构化信息,而目还包括数据巨大、种类繁多的非结构化的音频信息等。第3章 数字图像压缩技术1. 论述数据压缩的必要性和可行性。必要性:数字化后的图像和视频信息数据量非常大,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大差距。这样,就对图像信息的存储和传输造成了很大困难,成为阻碍人们有效获取和利用信息的一个瓶颈问题。不对图像数据进行有效的压缩,就难以保证通信的顺利进行。可行性:冗余是图像压缩的着眼点。冗余
13、主要包括数据间冗余、信息熵冗余以及视觉冗余。2. 图像信息数字化过程主要包括哪些步骤? 它与音频信息数字化有何区别? 图像信号数字化主要包括两方面的内容:取样和量化。与音频的主要区别在于图像是二维信号,取样和量化要在二维信息上进行。3. 图像压缩方法按所采用的技术可分为为哪几类?简述各种图像压缩方法的基本原理。按采用技术主要的压缩方法包括信息熵编码、预测编码、变换编码、子带编码、统计编码、基于模型的压缩编码、神经网络编码、分形编码和小波编码等。w1 0.30w2 0.25w3 0.20w4 0.10w5 0.10w6 0.0500011101100.150.250.451.04. 设一幅图像有
14、6个灰度级W=W1,W2,W3,W4,W5,W6,对应各灰度级出现的概率P=0.3, 0.25, 0.2, 0.1, 0.1, 0.05,试对此图像进行哈夫曼编码并计算其编码效率。0.55W1 00, W2 01, W3 11, W4 101, W5,1000, W6 1001H=-i=16Pilog2P=2.365iL=-i=16iPi=2.4 编码效率98.5%5. 比较预测编码和变换编码的抗误码性能并说明其原因。变换编码的抗误码能高于预测编码。预测编码是对真实值与预测值之间的差值信号进行编码处理和传输,达到压缩的目的。在预测编码中,接收端是以所接收的前个样本为基准来预测当前样本,因而如果
15、信号传输过程中一旦出现误码,就会影响后续像素的正确预测,从而出现误码扩散现象。变换编码不直接对原图像信号压缩编码,而首先将图像信号映射到另一个域中,产生一组变换系数,然后对这些系数进行量化、编码、传输。在空间上具有强相关性的信号,反映在频域上是能量常常被集中在某些特定的区域内,或是变换系数的分布具有规律性,因此变换编码抗误码性能较强。6. 分析并比较算数编码与哈夫曼编码。算术编码和哈夫曼编码都是熵编码,都可以实现无失真编码。哈夫曼编码的编码效率与信源符号概率分布相关,编码不唯一,抗误码性差,只能用近似的整数位来表示单个符号。在信源概率分布比较均匀情况下,哈夫曼编码的效率较低,而此时算术编码的编
16、码效率要高于哈夫曼编码,同时又无需像变换编码那样,要求对数据进行分块,因此在JPEG扩展系统中以算术编码代替哈夫曼编码。7. 介绍运动补偿的概念,并说明在预测编码中使用此概念的原因。运动补偿:利用运动矢量建立处于前后帧的同一物体的空间位置对应关系,即用运动矢量进行运动补偿预测。在帧间预测编码中,为了达到较高的压缩比,最关键的就是要得到尽可能小的帧间误差。在普通的帧间预测中,实际上仅在背景区进行预测时可以获得较小的帧间差。如果要对运动区域进行预测,首先要估计出运动物体的运动矢量V,然后再根据运动矢量进行补偿,即找出物体在前一帧的区域位置,这样求出的预测误差才比较小。总而言之,就是利用运动补偿减小
17、帧间预测误差,提高编码效率。8. 解释小波变换编码的基本思想。小波变换图像编码的主要工作是选取一个固定的小波基,对图像作小波分解,在小波域内研究合理的量化方案、扫描方式和熵编码方式。关键的问题是怎样结合小波变换域的特性,提出有效的处理方案。 小波变换对图像进行压缩的原理与子带编码方法是十分相似的,是将原图像信号分解成不同的频率区域(在对原图像进行多次分解时,总的数据量与原数据量一样,不增不减),然后根据HVS(人眼的视觉特性)及原图像的统计特性,对不同的频率区域采取不同的压缩编码手段,从而使图像数据量减少,在保证一定的图像质量的前提下,提高压缩比。9. 试述H.263与H.261的区别。H.2
18、6x是ITU-T(国际电信联盟)及其前身CCITT(国际电报电话咨询委员会)研究和制定的一系列视频编码的国际标准。H.261是ITU-T制定的视频压缩编码标准,也是世界上第一个得到广泛承认的、针对动态图像的视频压缩标准,而且其后出现的MPEG系列标准、H.262以及H.263等数字视频压缩标准的核心都是H.261。H.263在H.261基础上做了很多改进。H.263能够支持更多图像格式,H.263建议的两种运动估值,H.263采用半精度像素的预测值和高效的编码,H.263提高数据压缩效率。10. 查阅相关资料,阐述图像压缩方法的最新进展。略第4章 多媒体信息输入输出及存储技术1. 简述声卡的工
19、作原理。音频信息的输入输出主要是由声卡来完成的。声卡或音频卡(audio card)是负责录音、播音和声音合成的计算机硬件插卡,是计算机进行所有与声音相关处理的硬件设备。声卡的结构如图4-1所示。总线接口芯片为声卡的各个部分与计算机系统总线间提供握手信号,同时总线接口芯片还起到对指令和数据的缓冲器作用,完成声卡与计算机系统总线之间指令和数据的传送。数字音频处理芯片完成各种音频信号的记录和播放任务,处理工作还包括ADPCM音频信号的压缩和解压缩、采样频率改变、MIDI指令解释等。音乐合成器负责MIDI的合成音效,可以即时创造声音,将数字音频的波形数据和MIDI信息合成为声音。一般声音的变化是用一
20、些电压、电流这样的模拟信号的变化来反映的,而计算机只能处理数字信号,声卡中的AD转换器负责将接收的模拟信号转成数字信号供计算机处理或将数字化的音频信号转换为模拟信号送出去,驱动音箱或耳机发音。混音器将从话筒、线性输入、CD输入的不同途径声音信号进行混合,还提供用软件控制音量的功能。图4-1 声卡的结构2. 简述视频卡的工作原理。视频卡的基本工作原理如图4-2所示。图4-2 视频卡的工作原理为了适应多种视频源的应用,视频卡一般都具有多个不同视频接口,分别对应录像机、影碟机和摄像机等视频源,可以通过相应的视频软件来选择所需视频源。图中的选择视频源完成对相应视频源的选择。ADC完成视频解码,主要是模
21、拟图像信号至数字图像信号的转换和解码。视频处理芯片是用于视频信号的捕获、播放和显示的专用控制芯片,可以完成视频输入信号的裁减、比例变化、VGA同步、色键控制、PC总线接口和对帧存储器的操作。视频处理器输出的是经过处理的RGB信号,与VGA显示卡输出的RGB信号是完全同步的,通过某种方法完成两路信号的叠加。视频随机访问存储器(VRAM)是专门为视频显示设计的存储器,可提供两个端口的同步读写能力,比一般的DRAM方式快得多。DAC主要完成数模转换,将叠加的信号转换成模拟信号,最后在显示器中进行显示。3. 简述光盘库的组成。光盘库系统是一种带有自动换盘装置(机械手)的光盘存储共享设备,一般由放置光盘
22、的光盘架、自动换盘机构(机械手)和驱动器三部分组成。光盘库系统包含一个或多个光驱动器,由精确伺服控制的机电机械手自动升降器机构来在盘片堆找上的槽和驱动器之间来回移动光盘。当用户访问光盘库时,自动换盘机构首先将驱动器中的光盘取出并放置在指定的盘架位置上,然后将光盘送入驱动器。在盘播放完毕后机械手机构从驱动器上将盘卸下并放回堆栈上它的槽内。在程序控制下,机械手设备可操作和管理多个驱动器。一套光盘库一般由212个盘仓组成,每个盘仓可容纳50片光盘,最多可以容纳多达600张光盘,总容量可以达到几百GB甚至TGB。4. 多媒体数据库的体系结构有哪几种?主要有联邦型结构,集中统一型结构,客户/服务器结构等
23、3种。5. 简述基于内容检索的处理过程。基于内容的检索就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据。基于内容的查询和检索是一个逐步求精的过程,存在着一个特征调整,重新匹配的循环过程,如图4-13所示: 图4-13 基于内容的检索过程(1) 初始检索说明用户开始检索时,要形成一个检索的格式。最初可以用OBE或特定的查询语言来形成。系统对示例的特征进行提取,或是把用户描述的特征映射为对应的查询参数;(2) 相似性匹配将特征与特征库中的特征按照一定的匹配算法进行匹配。满足一定相似性的一组候选结果按相似度大小排列返回给用户;(
展开阅读全文