书签 分享 收藏 举报 版权申诉 / 105
上传文档赚钱

类型多媒体数据压缩课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4106679
  • 上传时间:2022-11-11
  • 格式:PPT
  • 页数:105
  • 大小:566.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《多媒体数据压缩课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    多媒体 数据压缩 课件
    资源描述:

    1、本章提纲多媒体数据压缩的概念和分类常用的压缩编码方法音频压缩标准图像和视频压缩标准3.1 多媒体数据压缩的概念和分类多媒体数据压缩的重要性数据冗余的类型数据压缩技术的性能指标数据压缩方法的分类3.1.1 多媒体数据压缩的重要性多媒体数据压缩编码是信息产业的关键技术F多媒体技术最大的难题是海量数据存储F以及电视信息数字化之后的数据传输数据量是否等于信息量电视信号F512*512*8*3=6291456=6.3Mb/sF6.3*30fps=188Mb/sF188/8=23.5MB/sF650MB光盘/23.5=27.5s语音信号F正常人说话频率20Hz-4KHzF采样定律F采样精度8位F4KHz*

    2、2*8=64Kb/s=8KB/sF与电视信号相比23.5MB/8KB=3000倍陆地卫星F陆地卫星(Land Sat-3)其水平和垂直分辨率分别为2340和3240,四波段,采样精度7位F2340*3240*4*7=212MbF按每天30幅计,每天数据量为212*30=6.36GbF每年的数据量高达2300Gb如此巨大的数据量给存储器的传输容量、通信干线的信道传输率以及计算机的运算速度都增加了极大的压力单纯用扩大存储容量、增加通信干线的信道传输率是不现实的数据压缩是行之有效的方法信息量和数据量的关系I=D-duI:信息量D:数据量du:冗余量3.1.2 数据冗余的类型冗余:信息存在的各种性质的

    3、多余度。冗余例子F中文广播员一分钟180个汉字,一个汉字2个字节,共360字节F采样一分钟:8k*60*8/8=480kB/分钟F480kB/360B=1000倍冗余冗余例子F中文百科全书扫描进计算机F200万字*2=4MBFB5扫描(182*257mm 300dpi 12pixel/mm)185*257*12*12*8/8=6.84MB200万字以1000页计算,数据量6.84GBF图像、视频数据冗余量更大数据冗余的类型数据冗余的类型空间冗余时间冗余信息熵冗余视觉冗余听觉冗余结构冗余知识冗余1、空间冗余在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,在数字化图像中表现为冗余示例空

    4、间冗余统计上认为其像素的信息存在冗余,这是冗余的一种。图像的冗余信息会产生生理视觉上的多余度,去掉这部分图像数据并不影响视觉上的图像质量,甚至对图像的细节也无多大影响,这说明数据具有可压缩性。可以在允许保真度的范围内压缩待存储的图像数据,以大大节省存储空间,同时在图像传输时也会大大减少信道的负荷。2、时间冗余它反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。示例空间冗余和时间冗余是把图像信号看作概率信号时所反映出的统计特性,因此,这两种冗余也被称为统计冗余。3、信息熵冗余信息量:从N个相等的可能事件中选出一个事件所需的信息度量和

    5、含量信息熵:指一堆数据所带的信息量,平均信息量就是信息熵(entropy)例如:从64个数中选出某个数。F可先问是否大于32?从而消除半数的可能F这样只需6次即可选出某个数每提问一次得到1 bit信息量,在64个数中选中某数所需的信息量是log2 64=6 bit信息量:从N个相等的可能事件中选出一个事件所需的信息度量和含量信息量和事件出现的概率有关,概率越大,信息量越小;概率越小,信息量越大I(x)=IP(x)=loga(1/P(x)=-logaP(x)若a=2 则信息量度量单位为bit 若a=e 则信息量度量单位为nit 若a=10,则信息量度量单位为哈特莱如果将信源所有可能事件的信息量进

    6、行平均,就得到了平均信息量。信息熵=平均信息量信息熵:指一堆数据所带的信息量,平均信息量就是信息熵(entropy)信息熵冗余无失真编码定理:F无失真编码极限=信源所含平均信息量(熵)F信源编码时,当分配给第i个码元类的比特数 b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。4、视觉冗余人眼对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。5、听觉冗余人

    7、耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余6、结构冗余数字化图像中的物体表面纹理等结构往往存在着冗余,这种冗余称为结构冗余。当一幅图有很强的结构特性,纹理和影像色调等与物体表面结构有一定的规则时,其结构冗余很大。例如,草席的纹理很规范清晰,它的图像就存在结构冗余。7、知识冗余由图像的记录方式与人对图像的知识差异所产生的冗余称为知识冗余。人对许多图像的理解与某些基础知识有很大的相关性。例如F人脸的图像F建筑物中的门、窗的形状、位置等等F这类规律性的结构可由先验知识和背景知识得到。人具有这样的知识,但计算机存储图像时还得把一个个像素信息存

    8、入,这就是知识冗余。3.1.3 数据压缩技术的性能指标评价压缩技术的三个指标评价压缩技术的三个指标l压缩比l恢复效果l压缩算法复杂度、速度另外也必须考虑每个压缩算法所需的硬件和软件。无损压缩 (图象质量不变)有损压缩3.1.4 数据压缩方法分类根据解码后数据与原始数据是否完全一致可以分为两大类:F无损压缩法:采用可逆编码方法实现的压缩称为无损压缩。这种方法的解码图像与原始图像严格相同,即压缩是完全可恢复的或没有偏差的。压缩比在2:15:1,又称冗余压缩法,熵编码法F有损压缩法;采用不可逆编码方法实现的压缩称为有损压缩。这种方法的还原图像较之原始图像存在一定的误差,但选择的压缩率应使视觉效果可被

    9、接受。压缩比几十到几百。又称熵压缩法数据压缩方法分类数据压缩方法预测编码变换编码统计编码(熵编码)F哈夫曼编码F行程编码F算术编码其它:子带编码、运动估计1、预测编码(Prediction Coding)预测编码的基本原理F是统计冗余数据压缩理论的三个重要分支之一,用预测编码减少数据时间和空间的相关性如果有一个数,通过数学模型能够精确地产生数据源,则不需要传输这个数通过以往的样本值 ,预测 ,将预测值与实际值相减,对差进行编码预测编码的基本思想F建立一个数学模型,利用以往的样本数据,对新样本值进行预测,将预测值与实际值进行相减,对其差进行编码F差值很小,可以减少编码码位典型的预测编码方法FDP

    10、CM(Differential Pulse Code Modulation):差分脉冲编码调制FADPCM(Adaptive DPCM):自适应的差分脉冲编码调制1、预测编码在多媒体通信的图像传输上使用预测编码是常用的方法,图像压缩中的“未来”是指下一个像素、下一条线或下一帧,一般景物在这三方面都有一定程度的冗余。同一帧图像内,相邻像素之间的相关性比较强,任何一像素均可以由与它相邻的且已被编码的点来进行预测估计。连续的若干帧中,“未来”的帧中也会有许多地方保留了“过去”的部分,如背景或静止的地方等。1、预测编码关键:建立一个理想的预测器(数学模型)如果能找到一个数学模型完全代表数据源,那么在接

    11、收端就能依据这一数学模型精确地产生出数据。但是,现实中的系统是无法找到一个完整的、贴切的数学模型的。实际上能找到的最好的预测器只能以某种最小化的误差对下一个采样作预测。1、预测编码优点F可以去除数据的时间和空间冗余,直观、简捷和易于实现,特别是用于硬件实现。F在传输速度要求很高的应用中,大多选用此方法。缺点F预测方法的不足使压缩能力有限,DPCM一般只能压缩到2-4bit/像素。2、变换编码(Transformation Coding)其实质是一种函数变换,从一个信号域变换到另一个信号域,使其更适于压缩该过程是可逆的如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能

    12、量较集中,再进行采样、编码就可以压缩数据。2、变换编码 变换本身是可逆的,因而其也是一种无损技术。然而,为了取得更满意的结果,某些重要系数的编码位数比其他的要多,某些系数干脆就被忽略了。这样,该过程就成为有损的了。数学家们已经构造了多种数学变换。除了傅里叶变换外,还有余弦、Hadamard、Haar、Karhunen-Loeve(K-L)变换。最实用最常用的数学变换是离散余弦变换(DCT)。3、统计编码(熵编码)原理:变字长编码定理F若各码字长度严格按照所对应符号出现概率的大小逆序排列,则其平均码长最小根据变字长编码定理,概率大的用短码字表达,反之用长码字表达。统计编码的目的是减少符号序列的冗

    13、余度,提高符号的平均信息量。3、统计编码它根据符号序列的统计特性,寻找某种方法把符号序列变换为最短的码字序列,使各码元承载的平均信息量最大,同时保证无失真地恢复原来的符号序列。如数字序列:742300000000000000000055 编码为:7423Z18553、统计编码典型的熵编码方法F哈夫曼编码方法(利用信源概率分布特性)F行程编码方法(利用相关特性)F算术编码(利用概率分布特性)哈夫曼编码Huffman在1952年提出了对统计独立信源达到最小平均码长的编码方法,又称最佳码。从理论上可以证明,这种编码具有即时性和唯一可译性。Huffman编码的基本原理是按信源符号出现的概率大小进行排序

    14、,出现概率大的分配短码,反之则分配长码。哈夫曼编码求信息熵F信源有4个符号Xa1a2a3a4概率1/21/41/81/8信息熵:H(x)=-1/2log2(1/2)-1/4log2(1/4)-1/8log2(1/8)*2 =1/2+1/2+3/4=1.75 bit/字符)(log)()(21iinixPxPxH哈夫曼编码编码步骤F信源符号按概率大小排列F出现概率最小的两个符号概率相加,合成一个概率F将合成概率看作一个新组合的符号概率,重复上述做法,直到最后只剩下两个符号概率为止F反过来逐步向前编码,每一步两个分支,各赋予一个 二进制代码对信源进行Huffman编码信源a1a2a3a4概率1/2

    15、1/41/81/81/401011/2011码字010110111平均码长L=1/2*1+1/4*2+1/8*3+1/8*3=1.75 bit/字符=H(x)编码效率100%码长1233哈夫曼编码编码码字长度不均匀在信源符号概率不均匀时效率高;若信源符号概率均匀,则不用huffman编码行程编码(run-length coding)又称运行长度编码或游程编码,该压缩算法是将一个相同值的连续串用一个代表值和串长来代替。以图像编码为例,可以定义在特定方向上具有相同灰度值的相邻像素为一轮,其延续长度称为连续的行程,简称为行程。行程终点位置由到前一行终点的相对距离确定,这样就可以由灰度行程来表示图像数

    16、据。例如,若沿水平方向有一串(M个)像素具有相同的灰度 N,则行程编码后,只传递两个值(N,M)就可以代替M个像素的M个灰度值N。行程编码分为定长行程编码和变长行程编码两种对传输差错很敏感F一位符号出错就会改变行程编码的长度,从而使整个图像出现偏移,因此一般要用行同步和列同步的方法把差错控制在一行一列之内。一组连续同值的若干像素可用两个值表示:像素的值和同值像素的个数。对于有许多相同颜色的图像区域,这种算法的压缩效果是很明显的。行程编码例如F有一串数码为000011111000,按上述的表示方法,则它的行程码为0453。F第一位表示该数码串的首码0;第二位表示有4个连续的0;第三位表示有5个连

    17、续的1;第四位表示l以后是3个0。由于二进制数的码非0即 l,因此无须在04后再写 l。算术编码(arithmetic coding)算术编码方法不是将单个信源符号映射成一个码字,而是把信源符号表示为实数0到1之间的一个区间,其长度等于该消息的概率。消息序列中的每个元素都要用来缩短这个区间。消息序列中元素越多,所得到的区间就越小,就需要更多的数位来表示这个区间。再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。原理算术编码算术编码的特点F不需要码表F当信源符号概率比较接近时,算术编码效率高于哈夫曼方法F实现方法复杂,尤其是硬件实现F JPEG成员对多幅图像的测试结果表明,算术编

    18、码比哈夫曼编码能提高5左右的效率。在JEPG的扩展系统中,用算术编码方法取代了哈夫曼方法。3.3 音频压缩标准音频压缩编码的基本方法电话质量的语音压缩标准调幅广播质量的压缩标准高保真立体声压缩标准3.3.1 音频压缩编码的基本方法3.3.2 电话质量的语音压缩标准ITU建议的用于电话质量的语音压缩标准 标准标准说说 明明G.711采用PCM编码,采样速率为8KHz,量化位数为8bit,对应的比特流速率为64Kbps。使用了非线性量化技术。G.721将64Kbps的比特流转换成32Kbps的流,基于ADPCM编码;每个数值差分用4位编码,采样率为8KHz。G.723一种以24Kbps运行的基于A

    19、DPCM的有损压缩标准。G.728采用LDCELP压缩技术;比特率为16Kbps,带宽限于3.4KHz;音质与32Kbps的G.721标准相当。3.3.3 调幅广播质量的压缩标准调幅广播质量音频信号的频率范围是50Hz7KHz,又称“7KHz音频信号”,当使用16KHz的采样频率和14bit的量化位数时,信号速率为224Kbps。1988年ITU制定了G.722标准,它可把信号速率压缩成64Kbps。3.3.4 高保真立体声音频压缩标准 高保真立体声音频信号的频率范围50Hz20KHz,在44.1KHz采样频率下用16bit量化,信号速率为每声道705Kbps。目前国际上比较成熟的高保真立体声

    20、音频压缩标准为“MPEG音频”。MPEG是动态图像编码的国际标准,“MPEG音频”是该标准中的一部分。3.4 图像和视频压缩标准静止图像压缩标准JPEG运动图像压缩标准MPEG系列FMPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21视频通信编码标准H.261、H.263运动静止图像专家组的M-JPEG其它:Real-Networks的RealVideo、微软公司的WMT以及Apple公司的QuickTime等3.4.1 静止图像压缩标准JPEG1986年ISO和CCITT成立联合图片专家组(Joint Photographic Experts Group)1992.1 提出

    21、“多灰度静止图像的数字压缩编码”(简称JPEG标准)草案F主要制订静态图像帧内压缩编码FISO/IEC 109181994.2 正式第一次编辑出版JPEG标准采用了混合编码方法,定义了两种基本压缩算法:F基于DCT变换并应用行程编码和熵编码的有损压缩算法,压缩率10 1100 1F基于空间线性预测技术(即DPCM)的无损压缩算法,压缩率大约为4 1JPEG编码框图原图像数据8*8块DCT变换量化器熵编码器压缩图像数据表说明表说明JPEG标准适用于彩色和单色多灰度或连续色调静止数字图像的压缩,可支持很高的图像分辨和量化精度有损压缩,压缩比大,通常压缩2040倍时,人眼基本看不出失真JPEG标准J

    22、PEG算法主要存储颜色变化,尤其是亮度变化,因为人眼对亮度变化要比对颜色变化更为敏感。只要压缩后重建的图像与原来图像在亮度变化、颜色变化上相似,在人眼看来就是同样的图像。其原理是不重建原始画面,而生成与原始画面类似的图像,丢掉那些未被注意到的颜色。JPEG2000高压缩率无损压缩渐进传输感兴趣区域压缩色彩模式丰富图像处理更简单3.4.2 运动图像压缩标准MPEG1988年成立了MPEG-Motion Picture Expert Group它吸收了JPEG和H.261标准1992年正式通过ISO/IEC 11172运动图像压缩编码标准MPEG-1,1993年8月第一次正式出版1995年5月正式

    23、编辑出版ISO/IEC 13818 MPEG-23.4.2 运动图像压缩标准MPEGMPEG的缔造者们原先打算开发四个版本:MPEG1到MPEG4,以适用于不同带宽和数字影像质量的要求,后来MPEG3被放弃。MPEG优于其他影像压缩方案的地方是F具有很好的兼容性F压缩比最高可达200:1F数据的损失小(1)MPEG-1标准 MPEG-1标准(ISO/IEC11172).1992年发布。F该标准分为视频、音频和系统三部分。它是一个通用标准,既考虑了应用要求,又独立于具体应用之上。F可适用于不同带宽的设备,如CDROM、VideoCD、CDi。F它的目的是把221Mbps的NTSC图像压缩到1.2

    24、Mbps,压缩率为200 1。这是图像压缩的工业认可标准。可针对SIF标准分辨率(对于NTSC制为352240;对于PAL制为352288)的图像进行压缩,传输速率为1.5Mbps,每秒播放30帧,用256kbps速率可进行立体声编码,具有CD音质,质量级别基本与VHS(广播级录像带)相当。MPEG-1的编码速率最高可达45Mbps,但随着速率的提高,其解码后的图像质量有所降低。MPEG数据流的结构数据流F视频流(运动序列)包括序列头一组或多组图像序列序列尾序列头图像组图像组。图像组序列尾图像组头图像(I,P,B)图像。图像序列层图像组层图像头宏块片(MBS)宏块片。图像层宏块片头宏块(MB)

    25、宏块。宏块片层18*828*838*848*858*868*8宏块层YCbCr8*8块层MPEG-1标准的图像帧类型帧内帧(Intra Picture)预测帧(Predicted Picture)插补帧(Bidirectional Picture)MPEG1标准编码原理采用了两种基本压缩技术F为减少时间冗余,采用1616个象素组成的像素块的运动补偿技术F为减少空间冗余,采用88图像块的DCT变换技术时间冗余的减少运动补偿技术F在MPEG1标准中,一帧图像分成许多宏块,作为估算运动的基本单元,称为运动补偿单元。F一个宏块由一个1616的亮度信息和两个88的色度信息组成,运动补偿以宏块为单位进行预

    26、测。F预测时在已经知道的图像帧中查找与当前块相近的图像块,用二维的运动矢量来描述宏块的运动补偿预测值,然后将当前宏块的实际数据减去预测值以得到预测误差。空间冗余的减少DCT变换F在运动补偿预测和运动补偿插值之后,将差值图像或插值图像分割成88的图像块,然后对每一块做DCT变换和量化,再用二维的行程长度编码(RLE)及可变长度编码(VLC)技术对这些系数进行编码。F采用MPEG1算法,可以把数字电视图像信号压缩到每个编码像素为0.51bit。对于35224030帧/秒的数字电视图象,数据率从71Mb/s压缩到1.2Mb/s。F经解压缩还原得到的彩色电视图像的质量与VHS的质量相当。MPEG-1标

    27、准的特点有损的,非平衡编码F有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x CD-ROM的速率压缩也能达到VHS的图像质量和高保真立体声的效果F非平衡编码意味着压缩一幅图像比解压缩慢的多MPEG1标准的应用应用领域FVCDFMP3音乐F数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。(2)MPEG-2标准 MPEG2标准(ISO/IEC13818).1994年发布。F设计目标:提供高级工业标准的图像质量以及更高的传输率。FMPEG-2标准的视频数据速率为4.15Mbs,典型传输速率为10

    28、Mbps,与MPEG-1兼容,适用于1.5Mbps100Mbps速率的编码范围。F能提供720480(NTSC)或720576(PAL)分辨率的广播级质量的视像,适用于包括宽屏幕和高清晰度电视(HDTV)在内的高质量电视广播。(2)MPEG-2标准 能够提供CD级的音质。MPEG2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道和多达七个伴音声道。可提供一个较广范围的可变压缩比,以适应不同的画面质量、存储容量以及带宽的要求。能够对分辨率可变的视频信号进行压缩编码,可在30 1或更低的压缩比时提供广播级的质量。MPEG-2标准解码器通常支持MPEG-1和MPEG-2两种标准压缩比可高达

    29、200 1,能够以每秒30帧的速度播放全屏幕的影像。实际的压缩比依赖于节目的内容和所需的重放质量。运动和背影的变化越多,所得到的压缩比就越低。MPEG-2应用领域视音频资料的保存 电视节目的非线性编辑卫星传输电视节目的播出 MPEG-1与MPEG-2的对比MPEG-1是以CD-ROM等存储媒体为主要对象的,上限比特速率限制为1.5Mbps;而MPEG-2是通用编码,有多领域的应用对象,上限比特速率根据等级分别界定共同点:两种编码都在编码器内部对输入图像进行运动预测,将其残差信号依次进行DCT、量化、之字型扫描、可变长度编码,解码器内进行的是编码器的逆处理从而得到解码图像MPEG-1和MPEG-

    30、2的对比(1)图像格式FMPEG-1只能处理逐行扫描图像,而MPEG-2不仅能处理逐行扫描图像,还能处理隔行扫描图像。F在色差格式方面,用MPEG-1只能处理4 2 0格式,而MPEG-2还能处理4 2 2格式和4 4 4格式。也就是说,用MPEG-2可处理几乎现有的所有图像格式。(2)图像质量F由于能适应各种图像格式和具有高质量编码图像所需的技术(编码方式的单元技术),MPEG-2可提供比 MPEG-1更高质量的图像。MPEG-1和MPEG-2的对比(3)比特流的可改变性F可改变性是指由一个比特流可解码成两种以上空间分辨率时间分辨率信噪比都不一样的图像。这几种可改变性既可单独使用,也可组合使

    31、用。FMPEG-2可提供3种可改变模式:空间可改变性、时间可改变性和信噪比可改变性。(4)兼容性FMPEG-2语法完全包含了MPEG-1语法,具有对MPEG-1的向后兼容性。F使用空间可改变性,可将MPEG-1比特流与MPEG-2比特流混合传送。(3)MPEG-4标准MPEG-4专家组成立于1993年。在1995年3月的Florence会议上初步定义了一个音频验证模型(Verification Model),并于1996年1月在Munich会议上定义了第一个视频验证模型,它提供了支持基于内容的视频表达环境。运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496

    32、)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。(3)MPEG-4标准目标:最初目标是适用于以移动电视电话为主要用途的64kbps以下的低速率;随着网络图像通信的发展,目标变为在多媒体环境中允许视频数据的有效存取,传输和操作。MPEG-4提供了一组工具与算法,通过这些工具与算法,从而支持诸如高效压缩,视频对象伸缩性,空域和时域伸缩性,对误码的恢复能力等功能。因此,MPEG-4视频标准就是提供上述功能的一个标准化工具箱。MPEG-4的编码理念是:基于对象F在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然

    33、后再对不同的对象分别解码,从而组合成所需要的视频和音频。F这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。MPEG-4用运动补偿消除时域冗余,用DCT消除空域冗余;为支持基于对象编码,MPEG-4还采用形状编码和与之相关的形状自适应DCT(SA-DCT)技术以支持任意形状视频对象编码。MPEG-4特点高速压缩基于内容交互基于内容分级扩展 MPEG4应用领域因特网视音频广播 无线通信电视电话静止图像压缩计算机图形、动画与仿真电子游戏(4)MPEG-7标准MPEG-7正式名称叫作“多媒体内容描述接口”(Mult

    34、imedia Content Description Interface),于98年10月提出总目标F扩展现在有限的查询能力,使其包括更多的信息形式,即确立各种类型的多媒体信息标准化的描述方法。使网上的多媒体内容变成象现在的文本内容一样,具有可搜索性。MPEG7的目标支持多种音频和视觉的描述根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求支持数据管理的灵活性、数据资源的全球化和互操作性。MPEG7MPEG7 并不是一种压缩编码方法,而是一个多媒体内容描述接口。MPEG7 力求能够快速且有效地搜索出用户所需的不同类型的多媒体影像资料MPEG7的应用数字化图书馆

    35、:图像分类目录、音乐字典等。多媒体目录服务 即黄页。广播式媒体选择:包括收音机频道、电视频道等。多媒体编辑:个人电子新闻服务、媒体著作。其它潜在的应用领域:教育、旅游信息、娱乐、购物 等。MPEG-7启示MPEG系列标准有一个原则:它不对编码方法做出规定,也就是说,它只规定最后的数据格式,而不管采用何种方法获得这些数据格式。这正是制订国际标准的一个重要原则。一方面,它为以后出现新的编码技术留下余地;另一方面,它为各大公司和研究所的技术竞争留下了宽广的舞台。(5)MPEG21制定MPEG-21标准的目的是F将不同的协议、标准、技术等有机地融合在一起;F制定新的标准;F将这些不同的标准集成在一起。

    36、MPEG-21标准其实就是一些关键技术的集成,通过这种集成环境就对全球数字媒体资源进行透明和增强管理,实现内容描述、创建、发布、使用、识别、收费管理、产权保护、用户隐私权保护、终端和网络资源抽取、事件报告等功能。3.4.3 视频通信编码标准(1)H.261FCCITT于1988年针对可视通信的需要,提出电视电话、电视会议H.261建议,H.261标准的名称为“视听业务速率为p64kb/s的电视图像编解码”,即P64kb/s视频编/解码标准,并于1990年获得批准。H.261H.261的图像可分为F全屏格式CIF:所需最低速率为320kbps亮度信号分辨率为360*288色度信号分辨率为180*

    37、144F四分之一屏格式QCIF:所需最低速率为64kbps亮度信号分辨率为180*144色度信号分辨率为90*72P*64kb/s视频编码压缩FP是一个可变参数,取值为130。FP=1或2时,只支持QCIF格式,用于窄带电视电话、静止或准静止图像传送;F当P6时,支持CIF格式,如电视会议等应用。由于位率的提高,复杂的画面能传送出去,画面质量也得到了提高和改善。P64kb/s视频编码压缩算法,是采用混合编码方案,即基于DCT的离散余弦变换编码方法和带有运动预测的差分脉冲编码调制(DPCM)编码方法的混合。P64kb/s标准的压缩算法与MPEG压缩算法有许多共同之处,只是传输速率P64kb/s覆

    38、盖较宽的信道频带(当P取值不同时速率不同),而MPEG是基于较窄的频带上传输。(2)H.263H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。H.263.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:FH.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;F数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠

    39、错能力;FH.263包含四个可协商的选项以改善性能;FH.263采用无限制的运动向量以及基于语法的算术编码;F采用事先预测和与MPEG中的P-B帧一样的帧预测方法;FH.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率3.4.4 M-JPEG标准M-JPEG(Motion-Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑M-JPEG的压

    40、缩和解压缩是对称的,可由相同的硬件和软件实现但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩,故压缩效率不高。M-JPEG标准M-JPEG的优点是:可以很容易做到精确到帧的编辑、设备比较成熟缺点是压缩效率不高 M-JPEG这种压缩方式并不是一个完全统一的压缩标准,不同厂家的编解码器和存储方式并没有统一的规定格式。这也就是说,每个型号的视频服务器或编码板有自己的M-JPEG版本,所以在服务器之间的数据传输、非线性制作、网络向服务器的数据传输都根本是不可能的。3.4.5 其它压缩标准Real Video F是Real Networks公司开发的在窄带(主要的互联网)上进行多媒体

    41、传输的压缩技术。WMT FWMT是微软公司开发的在互联网上进行媒体传输的视频和音频编码压缩技术,该技术已与WMT服务器与客户机体系结构结合为一个整体,使用MPEG-4标准的一些原理。QuickTime FQuickTime是一种存储、传输和播放多媒体文件的文件格式和传输体系结构,所存储和传输的多媒体通过多重压缩模式压缩而成,传输是通过RTP协议实现的。国际标准小结标准化是产业化成功的前提F早期的视频服务器产品基本都采用MJPEG标准,开创视频非线性编辑时代FH.261、H.263推动了电视电话、视频会议的发展。FMPEG-1成功地在中国推动了VCD产业FMPEG-2标准带动了DVD及数字电视等多种消费电子产业,其它MPEG标准的应用也在实施或开发中FReal-Networks的Real Video、微软公司的WMT以及Apple公司的QuickTime带动了网络流媒体的发展

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:多媒体数据压缩课件.ppt
    链接地址:https://www.163wenku.com/p-4106679.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库