管理学]数字图像处理技术与应用第5章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理学]数字图像处理技术与应用第5章课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理学 数字图像 处理 技术 应用 课件
- 资源描述:
-
1、第第5章章 图像编码与压缩图像编码与压缩n5.1 引言引言n5.2 图像保真度准则图像保真度准则n5.3 无损压缩技术无损压缩技术n5.4 无损预测编码无损预测编码n5.5 有损预测编码有损预测编码n5.6 图像变换编码基本原理图像变换编码基本原理n5.7 视频图像编码简介视频图像编码简介 第第5章章 图像编码与压缩图像编码与压缩n5.1 引言引言n 数字图像数据量很大,因此为了快速传输,总是希望进行合理的图像压缩。压缩的理论基础是信息论,是一种通过删除冗余的或者不需要的信息来达到压缩数据量目的的技术。虽然表示图像需要大量的数据,但是图像数据是高度相关的,或者说存在冗余(Redundancy)
2、信息,去掉这些冗余信息后可以有效压缩图像,同时又不会损害图像的有效信息。n 数字图像的冗余主要表现为以下几种形式:空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余和知识冗余。n1.空间冗余空间冗余 图像内部相邻像素之间存在较强的相关性所造成的冗余。也称为像素相关冗余。场景中总有一些物体,图像中就有一些目标,同一目标的像素之间一般具有相关性。根据相关性,由某一个像素的性质可以获得其邻域像素的性质,各像素的值可以由其邻近像素的值预测出来,每个独立的像素所携带的信息相对较少。图像中存在与像素间相关性直接联系的数据冗余,即为像素相关冗余,也称为空间冗余或几何冗余。第第5章章 图像编码与压缩图像编码与
3、压缩n2.时间冗余时间冗余 视频图像序列中的不同帧之间的相关性所造成的冗余。n3.视觉冗余视觉冗余 是指人眼不能感知或不敏感的那部分图像信息。人的眼睛对图像细节和颜色的辨认受到人的视觉特性的限制,人类最多能分辨 种颜色,而彩色图像用24表示,即 种颜色,这种数据冗余称为视觉冗余。162242第第5章章 图像编码与压缩图像编码与压缩n4.信息熵冗余信息熵冗余 也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,称为信息熵冗余。为表达图像数据需要使用一系列符号,如字母、数字等,用这些符号根据一定的规则来表达图像就是对图像进行编码。在这里对每个信息或事件所附的符号序
4、列称为码字,而每个码字里的符号个数称为码字的长度。当使用不同的编码方法时,得到的码字及其长度都会不同。第第5章章 图像编码与压缩图像编码与压缩n5.结构冗余结构冗余 是指图像中存在很强的纹理结构或自相似性。n6.知识冗余知识冗余 是指在有些图像中还包含与某些先验知识有关的信息。数字压缩技术利用了数据固有的冗余性和不相干性,将一个大的图像数据文件转换成较小的文件。经过压缩的文件可以在以后需要的时候以某种方式将原文件恢复出来,两个文件的大小之比即为压缩比。压缩比反映了图像文件的压缩程度。第第5章章 图像编码与压缩图像编码与压缩n 有些图像文件数据无损压缩的算法删除的仅仅是冗余的信息,因此可以在解压
5、缩时精确地恢复图像。有损压缩算法删除了不相干的信息,因此只能对原有的图像进行近似地重构,而不能精确的复原。有损压缩的算法可以达到较高的压缩比。对于多数图像来说,为了得到更高的压缩比,保真度的轻微损失是可以接受的。但是,有些图像是不允许进行有损压缩的。第第5章章 图像编码与压缩图像编码与压缩n 对图像文件进行压缩和解压缩都是需要时间的。图像文件在系统与系统之间或用户与用户之间进行交换时,这个时间是不容忽略的。所以要根据具体情况选择进行有损压缩和无损压缩,以及在速度和压缩比之间、保真度之间进行折衷。第第5章章 图像编码与压缩图像编码与压缩5.2 图像保真度准则图像保真度准则n 图像编码结果减少了数
6、据量,提高了存储和传输的速度。实际应用时需要将编码结果解码,恢复成图像的形式才能使用。根据解码图像对原始图像的保真程度,图像压缩的方法可以分为两大类:信息保存型和信息损失型。n 信息保存型在图像的压缩和解压缩的过程中没有信息损失,得到的解码图像与原始图像完全相同。信息损失型可以取得很高的压缩比。但是不能通过解码恢复原图像。需要一种测度描述解码图像对于原始图像的偏离程度,这些测度一般称为保真度准则。5.2 图像保真度准则图像保真度准则n1.客观保真度准则客观保真度准则n 1)均方根误差n 常用的准则是输入图像和输出图像的均方根误差。令f(x,y)表示输入图像,表示对输入图像压缩编码和解码后的近似
7、图像,则和之间的误差可以表示为n n ),(yxf),(),(),(yxfyxfyxe 5.2 图像保真度准则图像保真度准则n设图像的大小为 ,则 和 之间的均方根误差为NM),(yxf),(yxf2/110102),(),(1MxNyrmsyxfyxfMNe5.2 图像保真度准则图像保真度准则n2.主观保真度准则主观保真度准则 5.3 无损压缩技术无损压缩技术n 无损压缩算法可以分为两大类:基于字典的技术和基于统计的方法。基于字典的技术生成的文件包含的是定长码,每个码字代表原文件中数据的一个特定的序列。基于统计的方法通过用较短代码代表频繁出现的字符,用较长的代码代表不常出现的字符,从而实现图
8、像数据文件的压缩。5.3.1 基于字典的技术基于字典的技术1.行程编码行程编码 最简单的基于字典的压缩技术是行程编码(Run Length Encoding,RLE),是一种熵编码。对于某些图像的一些区域,它们是由相同的灰度或颜色的相邻像素组成的。在一个逐行存储的图像中,具有相同灰度值的一些像素组成序列,称为一个行程。可以只存一个代表那个灰度值的码,后面是行程的长度,而不需要将同样的灰度值存储很多次,这就是行程编码。它对有单一颜色背景下物体的图像可以达到很高的压缩比,但对其它类型的图像压缩比就很低。n 行程编码比较适合于二值图像的编码,一般用于量化后出现大量零系数连续的场合,用行程来表示连零码
9、。如果图像是由很多块颜色或灰度相同的大面积区域组成的,那么采用行程编码可以达到很高的压缩比。如果图像中的像素中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。为了达到较好的压缩效果,在进行图像编码时不单独采用行程编码,而是和其他编码方法综合使用。5.3.1 基于字典的技术基于字典的技术n例1 某一图像的第i行为(180,180,180,)共10000个数据,模仿RLE编码可以简单写成(180,10000)。n例2 某一图像的第i行为(ai1,ai2,ai3,aij),其中j=10000,如果仍然采用RLE编码,则写成(ai1,ai2,1,ai3,1,aij,1)共有200
10、00个数据,文件被加倍是显而易见的。5.3.1 基于字典的技术基于字典的技术n2.LZW编码编码 LZ编码是由Lemple和Ziv最早提出的无损压缩技术。它由Welch加以充实而形成了广泛应用的有专利保护的LZW算法。同RLE类似,它也是对字符串编码从而实现数据压缩。然而,与RLE不同的是,它在对文件进行编码的同时,生成特定字符序列的表以及它们对应的代码 5.3.1 基于字典的技术基于字典的技术n LZW编码的基本思想:在编码过程中,将所遇到的字符串建立一个字符串表,表中的每个字符串都对应一个索引,编码时用该字符串在字串表中的索引来代替原始的数据串。例如,一幅8位的灰度图像,可以采用12位来表
11、示每个字符串的索引,前256个索引用于对应可能出现的256种灰度,由此可建立一个初始的字符串表,而剩余的3840个索引就可分配给在压缩过程中出现的新字符串,这样就生成了一个完整的字符串表,压缩数据就可以只保存它在字符串表中的索引,从而达到压缩数据的目的。5.3.1 基于字典的技术基于字典的技术 5.3.2 统计编码技术统计编码技术n1.哈夫曼编码哈夫曼编码n 哈夫曼编码(Huffman Coding)是图像压缩中最重要的编码方式之一,它是1952年由哈夫曼提出的无损的统计编码方法。是一种非等长最佳编码方法。用变长的码来使冗余量达到最小。编码器的输出码字是字长不等的编码,按编码输入信息符号出现的
12、统计概率不同,给输出码字分配以不同的字长。在编码输入中,对于那些出现概率大的信息符号编以较短的字长的码,而对于那些出现概率小的信息符号用较长的字长的编码。其编码结构实际上是一个二叉树,使常出现的字符用较短的码代表,不常出现的字符用较长的码代表。n 观察符号序列,发现s0,s1,s2这三个符号出现的频率比较大,其他符号出现的频率比较小,如果采用一种编码方案使得s0,s1,s2的码字短。其他符号的码字长,这样就能够减少符号序列占用的位数。5.3.2 统计编码技术统计编码技术n设s0=01,s1=11,s2=101,s3=000,s4=0010,s5=0001,s6=0011,s7=100n那么符号
13、序列变成n01 11 100 01 11 0011 101 101 0000 0010 0001 01 01 11 共39bit5.3.2 统计编码技术统计编码技术n 尽管s4,s5,s6的码字由原来的3位变成4位变长了,但是使用频繁的几个码字s0,s1变短了,使得整个序列的编码缩短,实现了数据的压缩。编码必须保证不能出现一个码字和另一个码字的前几位相同的情况,例如:如果的码字为01,的码字为011,那么当序列中出现011时,便无法判断是的码字后面跟了个1,还是完整的一个的码字。按照哈夫曼编码算法就可以保证编码正确,如图5.1所示为哈夫曼编码树示意图。5.3.2 统计编码技术统计编码技术nHu
14、ffman编码算法步骤:(1)统计出每个符号出现的频率,s0-s7出现的频率分别为4/14,3/14,2/14,1/14,1/14,1/14,1/14,1/14;5.3.2 统计编码技术统计编码技术(2)从左到右将上述频率按从小到大的顺序排列;(3)每次选出最小的两个值,作为二叉树的两个叶子的节点,将它们的和作为其根节点。之后,这两个叶子节点不再参与比较,新的根节点参与比较;(4)重复步骤3,直到最后得到和为1的根节点;(5)将形成的二叉树的左节点标0,右节点标1。把从最上面的根节点到最下面的叶子n节点途中遇到的0,1序列串起来,就得到了的编码。Huffman编码Huffman编码n 产生Hu
15、ffman编码需要对原始数据扫描两遍。第一遍扫描要精确地统计出原始数据中每个值出现的频率,第二遍是建立Huffman树并进行编码。由于需要建立二叉树并遍历二叉树生成编码,因此Huffman编码数据压缩和还原速度都较慢。但是哈夫曼编码简单有效,因而得到了广泛的应用。n2香农编码(shannon coding)n 香农编码的过程与哈夫曼编码有些相似。其编码步骤简述如下。n(1)图像灰度级按概率递减顺序排序;n(2)将分成两组,每组的概率和相同或相似。对第一组分配代码“0”,第二组分配代码“1”;n(3)执行步骤(2)后,若每组还是由两个或两个以上的灰度级组成,就重复上述步骤,直到每组只有一个灰度级
16、。n至此,可获得表5.2所示的香农编码,由表5.2可计算出香农编码的平均码字长度。5.3.2 统计编码技术统计编码技术 5.3.2 统计编码技术统计编码技术n 表5.2香农编码与哈夫曼编码5.4 无损预测编码无损预测编码n 预测编码的基本思想是通过仅对每个像素中提取的新信息编码,来消除像素之间的冗余。这里一个像素的新信息定义为该像素的当前或现实值与它预测值的差值。n 一个无损预测编码系统主要由一个编码器和一个解码器组成,它们各有一个相同的预测器,如图5.2所示。5.4 无损预测编码无损预测编码图5.2 无损预测编码系统 5.4 无损预测编码无损预测编码n 当输入图像的像素序列逐个进入编码器时,
17、预测器根据若干个过去的输入产生对当前输入像素的预测值,也称为估计值。将这个预测值进行整数舍入,得到预测器的输出值,则由此产生的预测误差表示为kkkffe 5.4 无损预测编码无损预测编码n 预测误差可以用符号编码器,借助变长码进行编码用以产生压缩图像数据流的下一个元素。利用解码器,根据接收的变长码字重建预测误差,则解压缩图像的像素序列表示为kkkfef5.4 无损预测编码无损预测编码n 利用预测器,可以将对原始图像序列的编码转换成对预测误差的编码。由于在预测比较时,预测误差的动态范围会远小于原始图像序列的动态范围,所以对预测误差的编码所需的比特数会大大减少,这是预测编码可以获得数据压缩结果的原
18、因。n 在多数情况下,可以通过将个先前的像素进行线性组合得到预测值。5.4 无损预测编码无损预测编码n 将m个先前的像素进行线性组合得到预测值。n式中,m称为线性预测器的阶,R是舍入函数,ai是预测系数。下标n为图像序列的空间坐标,在一维线性预测编码中,设扫描沿行进行,式(5.5)可以表示为inmiinfaRf1 5.4 无损预测编码无损预测编码n 一维线性预测仅是当前行扫描到的先前像素的函数。在二维线性预测编码中,预测是对图像从左向右,从上向下进行扫描时所扫描到的先前像素的函数。在三维线性预测编码中,预测基于上述像素和前一帧的像素。预测误差的概率密度函数一般用零均值不相关拉普拉斯概率密度函数
19、表示为),(),(1yixfaRyxfmiin 5.4 无损预测编码无损预测编码n式中,是e的标准差。eeeeep2exp21)(e 5.5 有损预测编码有损预测编码n 有损预测编码系统与无损预测编码系统相比,主要增加了量化器。量化器的作用是将预测误差映射到有限个输出 中,决定了有损预测编码中的压缩量和失真量。有损预测编码系统组成如图5.3所示。ke ke 5.5 有损预测编码有损预测编码 图 5.3 有损预测编码系统 5.5 有损预测编码有损预测编码n 解码器的输出表示为n式中,为过去预测值,为量化误差函数,为解码器的输出。如图5.3所示的闭环结构可以防止在解码器的输出端产生误差。kkkfe
20、fkfke kf5.6 图像变换编码基本原理图像变换编码基本原理n 图像的变换编码是利用某种变换将空间域里描述的图像 ,变换为变换域中描述的 。对变换域中 编码压缩,比对空间域压缩更为有效。因为在频域中相关性明显下降,能量主要集中于少数低频分量系数上。通常采用正交变换。例如傅里叶变换、沃尔什变换、离散余弦变换等。以傅里叶变换为例,变换具有能量集中于少数低频系数、各系数不相关、高频分量衰减很快且能量较小等性质。这些性质都可以用于图像数据压缩。),(yxf),(vuF),(vuF5.6 图像变换编码基本原理图像变换编码基本原理n 变换编码就是对数字图像经过正交变换的系数矩阵进行量化编码。图5.4所
21、示为变换编解码系统的组成框图。系统由五部分组成,图像输入与变换、系数量化编码、信道传输、解码和逆变换。在变换阶段,将原始图像划分成若干子块,对每个子块进行某种正交变换。通过变换,降低或消除相邻像素之间或相邻扫描行之间的相关性,提供用于编码压缩的变换系数矩阵。编码过程实现图像信息的压缩。在变换域中,图像信号的绝大部分能量集中在低频分量部分,编码中如果略去那些能量很小的高频分量,或者给这些高频分量分配较小的合适的比特数,就可以明显减少图像传输或存储的数据量。5.6 图像变换编码基本原理图像变换编码基本原理 5.4 正交变换及编解码框图5.7 视频图像编码简介视频图像编码简介n 随着计算机网络及通信
22、技术的迅速发展,图像通信受到该领域科技工作者的广泛关注。国际标准化组织(ISO)、国际电工委员会(IEC)和国际电信联盟(ITU)下属的国际电报电话咨询委员会(CCITT)等国际组织积极致力于图像处理的标准化工作。特别是图像编码,涉及到多媒体、数字电视、可视电话、会议电视等图像传输方面的广泛应用,为此制定的国际标准极大地推动了图像编码技术的发展与应用。这些图像编码的国际标准有:JPEG、MPEG、H.26x等标准。5.7.1 JPEG标准标准n 1986年,ISO和CCITT成立了“联合图片专家组”(Joint Photographic Expert Group),主要任务是研究静止图像压缩算
23、法的国际标准。1987年用Y:U:V=4:2:2,每像素16比特,宽度为4:3的电视图像进行了测试,选择出三个方案进行评选,其中的DCT方案得分最高,它制定的以自适应离散余弦变换编码(ADCT)为基础的“连续色调静止图像压缩编码”JPEG标准于1991年3月正式提出。5.7.1 JPEG标准标准n JPEG标准根据不同的应用场合对图像的压缩要求提出了几种不同的编、解码方法,主要分为基本系统、扩展系统和信息保持型系统。所有符合JPEG标准的编码器都必须支持基本系统,而其他系统则作为不同应用目的的选择项。n基本系统提供顺序建立方式的高效有失真编码,输入图像的精度为8比特/像素。图5.5所示为JPE
24、G标准基本系统的编码器结构图,图中,量化用Q表示,IQ表示反量化。编码器对彩色图像采用分量编码。5.7.1 JPEG标准标准n 图5.5 JPEG基本系统编码器结构图JPEG基本系统组成模块基本系统组成模块 5.7.1 JPEG标准标准n (1)将整个图像分为不重叠的 像素子块,共有Y、U、V三幅数字图像,Y表示图像的亮度,即明暗程度,UV代表图像色彩度。n (2)对各个子块进行DCT变换,n (3)对所有的系数进行线性量化。量化的过程是对系数值的量化间距划分后的简单的取整运算,量化步长取决于一个视觉阈值矩阵,它随系数的位置而改变,并且对Y和UV分量也不相同。利用这些阈值,在编码率小于1比特/
25、像素的条件下依然可以获得非常好的图像质量。当把量化步长乘以一个公共因数后,一般可以调整比特数,由此可以实现自适应编码。88 5.7.1 JPEG标准标准n(4)对DCT量化系数进行熵编码,进一步压缩码率。可以采用算数编码或Huffman编码(可变字长编码VLC)。对于当前子块的DC系数与上一块的DC系数之差值进行VLC编码压缩数据,由于DC分量是子块的平均值,相邻子块间的相关性很强,同时,视觉上要求各子块的平均灰度无明显的跳跃,因此对DC的差值作无失真的熵编码是合适的。对于AC系数不为零,采用Z字形方式(Zig-zig)进行一维扫描,然后将非零系数前面的0的游程长度(个数)与该系数值一起作为统
展开阅读全文