数字图像处理-课件-2.pptx

上传人（卖家）：晟晟文业

文档编号：4446004

上传时间：2022-12-10

格式：PPTX

页数：227

大小：14.62MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

32 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《数字图像处理-课件-2.pptx》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 数字图像处理课件 _2

资源描述：: 1、12要想成功，就必须弄清基础问题。亚里士多德 3p 2.1节简述人类视觉系统的机理。p 2.2节讨论光、电磁波谱的其他分量及它们的成像特点。p 2.3节讨论成像传感器及怎样使用它们产生数字图像。p 2.4节介绍均匀图像取样及灰度量化的概念。p 2.5节介绍像素间的各种基本关系。p 2.6节介绍本书用到的主要数学工具。45睫状小带视轴玻璃体中央凹盲点神经和鞘前房6上图显示了人眼的一个简化水平剖面。眼睛的形状近似为一个球体，其平均直径约为20mm。有三层薄膜包围着眼睛：1、角膜是一种硬而透明的组织，覆盖着眼睛的前表面。2、巩膜与角膜相连，巩膜是一层包围着眼球其余部分的不透明的膜。73、脉络膜位于巩
2、膜的正下方。4、脉络膜的最前面分为睫状体和虹膜。5、虹膜的收缩和扩张控制着进入眼睛的进光量。虹膜中间的开口（瞳孔）的直径是可变的，范围大约在28mm。6、晶状体由同心的纤维细胞层组成，并由附在睫状体上的纤维悬挂着。87、眼睛最里面的膜是视网膜，它布满了整个后部的内壁。当眼睛适当地聚焦时，来自眼睛外部物体的光在视网膜上成像。由视网膜表面分布的不连续的光感受器提供了图案视觉。有两类光感受器：和。9每只眼睛中的。它们主要位于视网膜的中间部分，称之为，且对颜色高度敏感。通过这些锥状体，人可以充分地分辨图像细节。视觉称为或。10。杆状体用来给出视野内的一般的总体图像。它们没有彩色感觉，而对低照明度敏感。
3、视觉称为或。1112中央凹本身是视网膜中直径约为1.5mm的圆形凹坑。我们可以把中央凹看成是大小为1.5mm1.5mm的方形传感器阵列。在视网膜这一区域中，锥状体的密度大约为15万个/mm2。基于这一近似，眼睛中最高敏感区域中央凹的锥状体数量约为33.7万个。从自然分辨能力的角度看，恰好与一个中等分辨率的电荷耦合元件CCD成像芯片具有的元素数量相当，接收器阵列不大于5mm5mm。13顶尖学术期刊Cell2019年2月21日新出炉的一期，封面格外吸引人的“眼球”：我们人类的一位大兄弟正聚精会神地“看”着什么人类的视觉出类拔萃，比如我们能够阅读，分辨人脸。这些功能可不简单
4、，需要视觉能够分辨极细微的差异，并能迅速对焦。，也就是眼底黄斑的中心。中央凹的直径不到1.5毫米，面积只占视网膜的不到1%，但大脑获得的视觉信息却有50%来自这里。14中央凹的特殊，还不仅是因为视线的“焦点”落在此处提供清晰影像，只有部分灵长类生物进化出了这个结构，比如人类。中央凹处的细胞检测到表达与外周不一样的基因。非常有意思的是，科学家们相信，可能这才是中央凹功能特殊的原因。1516在普通照相机中，镜头有固定的焦距，各种距离的聚焦是通过改变镜头和成像平面间的距离实现的，。在人眼中，则与此相反。晶状体和成像区域（视网膜）之间的距离是固定的，睫状体中的纤维可实现这一功能，在远离或接近目标物时纤
5、维会分别变扁或加厚晶状体。17h表示视网膜图像中物体的高度h=2.55mm151000.017h18视网膜图像主要聚焦在中央凹区域。然后，光接收器的相对刺激作用产生感知，把辐射能转变为电脉冲，最后由大脑解码。失明的原因有很多，不过其中之一就是视网膜的视锥和视杆细胞发生了病变，无法顺利使光信号转变为电信号。这些光感受器细胞如果不能行使正常的功能，即使眼睛的其他部分都是健康的，也不能够产生有质量的视觉。19视网膜中的光感受器一旦损伤或退变，由于不能自行修复，往往会导致失明。如果能够使用人工光感受器来替代原有的视网膜功能，对于黄斑变性等疾病的患者来说，将是巨大的希望。来自复旦大学的研究团队开发了一种
6、“人工视网膜”，这是一种。研究人员将之植入失明小鼠的眼底，成功使得小鼠的视觉得到了恢复。20相关研究题为Nanowire arrays restore vision in blind mice，2018年3月6日发表在Nature Communications上。这种光感受器使用的是金/氧化钛纳米线阵列，阵列由二氧化钛纳米线组成，上面用金纳米颗粒修饰。21研究人员将这种“人工视网膜”植入了小鼠的眼底。当接收光照射时，小鼠的瞳孔会缩小，视网膜中的神经节细胞恢复了对光的响应。神经节细胞能把视觉信号经视神经向大脑视觉中枢传递。这是由于纳米线阵列吸收光线后，产生光电压并触发附近神经元的电活动，从而恢复
7、小鼠对光的敏感性。22这种纳米线光感受器有效地替代了原有视网膜中的视杆细胞和视锥细胞，因而，在植入后能够观察到视觉中枢的神经元也恢复了对光的响应，同时，瞳孔对光的反射也有所改善。这种新一代为黄斑变性等视网膜疾病提供了一个新的治疗选择：通过人工光感受器的植入，帮助患者恢复对视觉的响应。2324中国科学技术大学生命科学与医学部与美国马萨诸塞州州立大学医学院合作，结合视觉神经生物医学与创新纳米技术，首次实现动物裸眼红外光感知和红外图像视觉能力。该研究成果于2019年2月28日在线发表于国际顶级期刊Cell上，并被Cell杂志选为本期唯一科普视频进行重点推广。25能被我们眼睛感受的可见光只占电磁波谱里
8、很小的一部分，。在生物进化历程中，没有出现任何基于感光蛋白的，能够感知超过700nm的红外光的动物感光细胞，更无法在大脑中形成红外光图像视觉。26为解决上述问题并发展裸眼无源红外视觉拓展技术，尝试利用一种，导入动物视网膜中以实现红外视觉感知。在视网膜下腔注射pbUCNP纳米颗粒的小鼠不仅获得感知红外线的能力，还可以分辨复杂的红外图像。在获得红外视觉的同时，小鼠的可见光视觉没有受到影响。27这项技术不仅能赋予我们超级视觉能力，通过开发具有不同吸收和发射光谱参数的纳米材料，还有可能辅助修复视觉感知波谱缺陷相关疾病，例如红色色盲。2829因为数字图像作为离散的灰度集来显示，所以眼睛对不同亮度级别之间
9、的辨别能力在显示图像处理结果中是一个重要的考虑因素。30人的视觉系统能够适应的光强度级别范围是很宽的从暗阈值到强闪光约有1010个量级。实验数据指出，主观亮度（即由人的视觉系统感知的亮度）是进入人眼的光强的对数函数。31 32 视觉系统往往会在不同强度区域的边界处出现“下冲”或“上冲”现象。马赫带：厄恩斯特马赫于1865年首次描述了这一现象。33感知区域的亮度并不简单地取决于其强度。所有的中心方块都有相同的强度，但是当背景变亮时，它们就逐渐变暗。34在错觉中，眼睛填充了不存在的信息或者错误地感知了物体的几何特点。353637彩色光的电磁能谱跨越0.43m（）-0.79m（）的范围。38人
10、感受物体的颜色由物体反射光的性质决定。以所有可见波长相对平衡地反射光的物体，对观察者而言是白色的。一个物体在可见光谱的有限范围内反射时会呈现各种颜色色调。例如，绿色物体反射波长范围为500570nm的光，而吸收其它波长的大部分能量。39没有颜色的光称为单色光或无色光。单色光的唯一属性是它的强度或大小。单色光的强度：黑色灰色白色。从黑到白的单色光的度量值范围通常称为灰度级，而单色图像常称为灰度图像。40有三个基本量用于描述彩色光源的质量：发光强度、光通量和亮度：是从光源流出能量的总量，通常用瓦特(W)来度量。(lm)：用流明数度量的光通量给出观察者从光源感受到的能量。：是光感知的主观描绘子，它实
11、际上不能度量。它具体体现了强度的无色概念，是描述彩色感觉的参数之一。41 原理上，如果可以开发出一种传感器来检测由一种电磁波谱发射的能量，那么我们就可以在该波段上对感兴趣的事件成像。但要注意的一点是，要求“看到”一个物体的电磁波的波长必须小于等于物体的尺寸。42p成像以电磁波发射的能量为基础；p物体反射的声波也可用于形成超声波图像；p电子显微镜的电子束成像；p用于图形与可视化的合成图像。4344我们感兴趣的多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收而产生的。照射可以由电磁波谱的能源引起。场景元素可能是熟悉的物体，也可以是分子、沉积岩或人类的大脑。45依赖光源的特性，照射
12、被物体反射或透射。p第一类例子是从平坦表面反射。p第二类例子是为了产生一幅X射线照片，让X射线透过病人的身体。46将照射能量变换为数字图像的传感器配置：p通过将（电磁波谱的某个谱段）相组合，把输入能源转变为电压。p输出电压波形是传感器的响应，通过把传感器响应数字化，从每一个传感器得到一个数字量。472009年度诺贝尔物理学奖授予：美国科学家威拉德S博伊尔(Willard S.Boyle)和乔治E史密斯(George E.Smith)48威拉德S博伊尔和乔治E史密斯因为1969年发明了获此殊荣。这一发明使得数码相机、带有摄像头的手机等电子设备风靡全球，人类已经进入了全民数码影像的时代，每一个人都
13、可以随时、随地、随意地用影像记录每一瞬间。49CCD图像传感器的发明，实际上是应用。但是从理论到实践，道路却并不平坦。科学家遇到的最大挑战，在于。50经过多次试验，博伊尔和史密斯终于解决了上述难题。他们采用一种高感光度的半导体材料，将光线照射导致的电信号变化转换成数字信号。它革新了摄影术，使得光可以被电子化地记录下来，取代了胶片。这一数字形式极大地方便了对图像的处理和发送。51成像物镜将外界照明光照射下的（或自身发光的）景物成像在物镜的像面上，形成二维空间的光强分布（光学图像）。能够将二维光强分布的光学图像转变成一维时序电信号的传感器称为图像传感器。52 53 线性运动54平板扫描仪航空成像5
14、5 线性运动传感器条带成像区域56 57以圆环形方式安装的传感器带用于医学和工业成像，以得到三维物体的剖面（“切片”）图像。传感器的输出必须由重建算法处理，。58每个传感器单元的响应正比于投射到传感器表面的光能总量。59固体自扫描图像传感器是20世纪70年代发展起来的新型图像传感器件，如面阵CCD器件，CMOS图像传感器件等。CCD器件按其感光单元的排列方式分为线阵CCD和面阵CCD两类。60这类器件本身具有自扫描功能，例如。电荷图像在驱动脉冲的作用下按照一定的规则一行行地输出，形成图像信号。61结构简单，成本较低。可以同时储存一行电视信号。由于其单排感光单元的数目可以做得很多，在同等测量精度
15、的前提下，其测量范围可以做的较大。并且由于线阵CCD实时传输光电转换信号和自扫描速度快、频率响应高，能够实现动态测量，并能在低照度下工作。62所以线阵CCD广泛地应用在产品尺寸测量和分类、非接触尺寸测量、条形码等许多领域。线阵CCD的优点是一维像元数可以做得很多，而且像元尺寸比较灵活，帧幅数高，特别适用于一维动态目标的测量。63对于面阵CCD来说，应用面较广，如面积、形状、尺寸、位置，甚至温度等的测量。面阵CCD的优点是可以获取二维图像信息，测量图像直观。缺点是像元总数多，而每行的像元数一般较线阵少，帧幅率受到限制。64由于生产技术的制约，单个面阵CCD的面积很难达到一般工业测量对视场的需求。
16、线阵CCD的优点是分辨力高，价格低廉，但要用线阵CCD获取二维图像，必须配以扫描运动，而且为了能确定图像每一像素点在被测件上的对应位置，必须配以光栅等器件以记录线阵CCD每一扫描行的坐标。65p彩色线阵CCD图像传感器p分辨率：4096p像元尺寸：10m10mp帧频：4通道，23.7fpsp时钟：425MHzp动态范围：70dB66p黑白/彩色全帧CCD图像传感器p分辨率：40085344p像元尺寸：9m9mp帧频：4通道，3.6fpsp时钟：425MHzp动态范围：72dB，线性67输出数字图像CCD成像芯片的图像平面场景光源成像系统数字图像获取过程68我们用形如f(x,y)的二维函数来表示
17、图像。在空间坐标(x,y)处，f的值或幅度是一个正的标量，其物理意义由图像源决定。当一幅图像由物理过程产生时，其亮度值正比于物理源（如电磁波）所辐射的能量。因此，f(x,y)一定是非零的和有限的，即 0f(x,y)69函数f(x,y)可由两个分量来表征：p(1)入射到被观察场景的光源照射总量；p(2)场景中物体所反射的光照总量。这两个分量分别称为入射分量和反射分量，且分别表示为i(x,y)和r(x,y)。两个函数作为一个乘积合并形成f(x,y)。70(,)(,)(,)f x yi x y r x y0(,)i x y 0(,)1r x y对于X射线成像，用透射系数代替反射函数。71令单色图像在
18、任何坐标(x0,y0)处的强度（灰度）表示为，则l的取值范围为。区间称为灰度级（或强度级）。实际情况下常常令该区间为，其中为黑色，为白色。所有中间值是从黑色到白色之间变化的灰度色调。72计算机图像处理所使用的数字图像函数通常表示成矩阵的形式，因而其坐标是整数。图像函数的定义域是平面的一个区域 R。其中xm,yn表示最大的图像坐标。nmyyxxyxR1,1),(7374各种获取图像的方法的目的是就是从感知的数据生成数字图像。多数传感器的输出是连续的电压波形，这些波形的幅度和空间特性都与感知的物理现象有关。为了产生一幅数字图像，我们需要把连续的感知数据转换为数字形式。这种转换包括两种处理：和。75
19、为了用计算机来处理图像，图像必须用适当的离散数据结构来表达，例如，矩阵。传感器获取的图像是平面上两个坐标的连续函数f(x,y)。图像数字化是指将f(x,y)采样(sampled)为一个M行N列的矩阵。76图像量化(quantization)给每个连续的样本数值f一个整数数字。图像函数f(x,y)的连续范围被划分为K个区间。采样及量化越精细（即M，N，K越大），对连续函数的近似就越好。77p一幅图像的x和y坐标及幅度可能都是连续的。p为将它转换为数字形式，必须在坐标上和幅度上都进行取样操作。78有两个与图像采样有关的问题需要确定：1.其一是采样的间隔，即相邻两个采样图像点的距离，2.其二是采样点
20、的几何排列（采样栅格）。79一个连续的图像函数f(x,y)可以用平面上离散的栅格点来采样。图像的采样点是：x=ix，y=jy，i=0,M-1，j=0,N-1。两个相邻的采样点在x轴上相差x，在y轴上相差y。距离x和y为（x或y轴上的）采样间隔(sampling interval)。80采样的矩阵f(ix,jy)构成了离散图像。规格化栅格上的理想采样s(x,y)可以用一组狄拉克分布来表示：1010),(),(MiNjyjyxixyxs81采样后的图像fs(x,y)是连续图像函数f(x,y)和采样函数s(x,y)的乘积：公式中的狄拉克分布组合可以看作是周期为x和y的周期函数并展开为傅立叶级数。10
21、10),(),(),(),(),(MiNjsyjyxixyxfyxsyxfyxf82(,)(,)(,)sfx yf x ys x y1100(,)(,)MNxyijs x yxiyj 8384在图像分析中Shannon采样定理的一个简单的物理解释是：设已知图像中感兴趣的最小细节的尺寸，采样间隔应该比它的一半要小。在实际的数字转换器中采样函数不是狄拉克分布，而是有限冲击函数。85一个连续图像在采样点处被数字化。这些采样点是在平面上排列的，称它们之间的几何关系为栅格。栅格一般是方的。因此数字图像是一个数据结构，通常是矩阵。86栅格中一个无限小的采样点对应数字化图像中的一个像元或称像素(pixel)
22、；全体像素覆盖了整个图像，实际的数字转换器捕捉的像素具有有限的尺寸，这是因为采样函数不是一组理想的狄拉克冲激，而是一组有限冲激。87从图像分析的角度看，像素是不能再分割的一个单位。我们也常用一个“点”来指一个像素。888990在图像处理中，采样的图像数值fs(ix,jy)用一个数字来表示。为了使人能够觉察出图像的细微变化，量化的级别要足够的高。91大部分数字图像处理仪器都采用L个等间隔的量化方式。如果用k位来表示像素亮度的数值，那么亮度阶就是L=2k。92通常采用每个像素8位的表示方式，也有采用6位或4位。二值化图像，可以用1位来表示像素。有时也使用12位或更多位来表示一个像素。93 94连续
23、图像投影到传感器阵列图像取样和量化的结果9596979899有三种基本方法表示f(x,y)：1.用两个坐标轴决定空间位置，第三个坐标是以两个空间变量x和y为函数的f值（灰度值）；2.显示f(x,y)出现在监视器或照片上的情况；3.将f(x,y)的数值简单地显示为一个阵列（矩阵）。100画为表面图形的图像显示为可视灰度阵列的图像显示为二维数值阵列的图像101(0,0)(0,1)(0,1)(1,0)(1,1)(1,1)(,)(1,0)(1,1)(1,1)fffNfffNf x yf Mf Mf MN图像的MN的数值阵列表示1,11,10,11,11,10,11,01,00,0NMMMNNaaaa
24、aaaaaA图像的矩阵表示102数字图像的原点位于左上角，其中正x轴向下延伸，正y轴向右延伸。这种方便的表示基于这样的事实：许多图像显示（譬如电视显示器）扫描都是从左上角开始扫描第一行，然后向下移动一行，继续逐行扫描。更重要的事实是矩阵的第一个元素按惯例应在阵列的左上角。因此，将f(x,y)的原点选择在左上角于数学上是讲得通的。103原点在左上角，纵坐标垂直向下，横坐标水平向右。104数字化过程要求针对M值、N值和离散灰度级数L做出判定：pM和N：必须取正整数；pL：L2k 105 图像系统的动态范围定义为与。作为一条规则，上限取决于饱和度，下限取决于噪声。基本上，动态范围由。因此，也是图像的
25、动态范围。106107 我们定义一幅图像中和间的为。当一幅图像中像素可感知的数值有高的动态范围时，那么我们认为该图像具有高的对比度。相反，具有低动态范围的图像就很呆滞，看上去像冲淡了灰度。108低对比度高对比度109低对比度高对比度110存储数字图像所需的比特数b为：当M=N时，该式变为：下表中显示了N和k取不同值时需要用来存贮方形图像的比特数。括号中的数字表示对应于每个k值的灰度级数。bMNk2bNk111N和k取不同值时存储所需的比特数，L是灰度级数。当一幅图像有L=2k个灰度级时，实际上通常称该图像为一幅“k比特图像”。112空间分辨率是图像中可辨别的最小细节的度量。在数量上，空间分辫率
26、可以有很多方法来说明。其中和是最通用的度量。假设我们用交替的黑色和白色垂直线来构造一幅图形，其中线宽为W个单位（W可以小于1)。线对的宽度就是2W，每单位距离有1/2W个线对。例如，如果一条线的宽度是0.1mm，每单位距离（mm）就有5个线对。广泛使用的图像分辨率的定义是每单位距离可分辨的最大线对数量（譬如每毫米100个线对）。113每单位距离点数是印刷和出版业中常用的图像分辨率的度量。在美国，这一度量通常使用每英寸点数（dot per inch,dpi）来表示。例如，报纸用75 dpi的分辨率来印刷，杂志是133 dpi，光鲜的小册子是175 dpi，书页是以2044 dpi印刷的。114灰
27、度分辫率是指在灰度级中可分辨的最小变化。基于硬件考虑，正如前一节中提到的那样，灰度级数通常是2的整数次幂。最通用的是2的8次幂=256个灰度级。不像空间分辨率必须以每单位距离为基础才有意义，而灰度分辨率指的则是用于量化灰度的比特数。例如，通常说一幅被量化为256级的图像有8比特的灰度分辨率。115降低空间分辨率的典型效果1250 dpi300 dpi150 dpi72 dpi116研究N和k之间的关系：三类图像的典型等偏爱曲线。位于等偏爱曲线上的点对应于有相等的主观判定质量的图像。等偏爱曲线：人为主观感受到的图像的质量117内插是在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。从根
28、本上看，内插是用已知数据来估计未知位置的数值的处理。1181.几何变换可以消除图像获取时所出现的几何变形。2.如果我们需要匹配同一物体的两幅不同的图像，也需要用到几何变换。119120121122桶形畸变正常图像枕形畸变123：对图像平面上的像素进行重新排列以恢复原空间关系；：对空间变换后的像素赋予相应的灰度值以恢复原位置的灰度值。124设原图像为f(x,y)，受到几何形变的影响变成g(x,y)，这里(x,y)表示失真图像的坐标，它已不是原坐标(x,y)了。上述变化在一般情况下可表示为：其中s(x,y)和t(x,y)代表产生几何失真图像的两个空间变换函数。),(),(yxtyyxsx125最简
29、单的情况是线性失真：对一般的非线性二次失真：如果知道s(x,y)和t(x,y)的解析表达，就可以通过反变换来恢复图像。654321),(),(kykxkyxtkykxkyxs2121121098726524321),(),(ykxykxkykxkkyxtykxykxkykxkkyxs126在实际中通常不知道解析表达，为此需要在恢复过程的，。127下图中给出了一个在上的四边形区域和在上与其对应的四边形区域。设在四边形区域内的几何失真过程可用一对双线性等式表示。（是一般非线性二次失真的一种特例）87654321kxykykxkykxykykxkx128失真图校正图两个四边形区域共有4组（8个）已知
30、对应点，所以上面两式中的8个系数可以全部求得。129下图中左边是理想的原始不失真图，右边是实际采集的失真图。空间变换灰度赋值x,yx,yg最近邻()()()x,yx,y()f原始的不失真图实际采集的失真图130由图可见，由于失真，映射到，。前面讨论的空间变换可将原图(x,y)处的(x,y)点原图(x,y)处。131灰度插值在实现时可以有两种方案：例如，132前向映射x,yx,yg()()()x,yx,y()f(a)133：例如，。134后向映射x,yx,yg()()()x,yx,y()f(b)135q前向映射：由于在前向映射中，有一定数量的失真图像的像素有可能会映射到不失真图像之外，所以有些计
31、算方面的浪费。另外，这也需要较多的寻址。136q后向映射：相对来说，后向映射效率比较高。，所以后向映射在实际中用得更广泛。被许多空间变换的商业实现所采用，例如MATLAB。137对灰度插值的计算方法有多种。q最近邻插值；q双线性插值；q三次线性插值。138最近邻插值就是将离(x,y)点最近的像素的灰度值作为(x,y)点的灰度值赋给原图(x,y)处的像素。计算量小，但不够精确。空间变换灰度赋值x,yx,yg最近邻()()()x,yx,y()f139为了提高精度，可采用双线性插值。它利用的灰度值来。设(x,y)点的四个最近邻像素为A、B、C、D。其坐标分别为(i,j),(i+1,j),(i,j+1
32、),(i+1,j+1)。其灰度值分别为g(A)、g(B)、g(C)、g(D)。140AECBDFXY(a)x,y()()()()()(AgAgBgixEg)()()()()(CgCgDgixFg)()()()(),(EgEgFgjyyxg141将双线性插值的思路推广，只利用(x,y)点的任意3个不共线的近邻像素的灰度值就可计算(x,y)点处的灰度值。)()()(BgxxxxAgxxxxEgBAEABABE)()(),(CgxxxxEgxxxxyxgCEECEC142。它利用点(x,y)的16个最近邻像素的灰度值，根据下面的方法计算点(x,y)处的灰度值。设点(x,y)的16个最近邻像素为：A,
33、B,C,D,E,F,G,H,I,J,K,L,M,N,O,P，则计算点(x,y)的插值公式为：商业图像编辑程序的标准内插方法，例如Adobe Photoshop和Corel Photopaint。)(),(gWWyxgyx143其中g()表示相应16个最近邻像素的灰度值。Wx为横坐标插值的加权值，Wy为纵坐标插值的加权值，分别计算如下：1441.如果g()的横坐标值（即B,C,F,G,J,K,N,O），则：2.如果g()的横坐标值（即A,D,E,H,I,L,M,P），则：32321xxxddW32584xxxxdddW1453.如果g()的纵坐标值（即E,F,G,H,I,J,K,L），则：4.如
34、果g()的纵坐标值（即A,B,C,D,M,N,O,P），则：32321yyyddW32584yyyydddW146复杂的几何变换可以通过将图像分解为更小的矩形子图像来近似。对于每个子图像可以用对应的像素对来估计一个简单的几何变换。这样几何变换就可以在每个子图像中分别修复了。147最近邻插值双线性插值双三次插值由213162像素放大到36922812像素由426324像素放大到36922812像素148 最近邻插值双线性插值双三次插值 149150一幅数字图像由有限大小的像素组成，像素反映图像特定位置处的亮度信息。通常像素按照矩阵采样栅格布置。我们用两维矩阵来表示这样的数字图像。矩阵的元
35、素是整数，对应于亮度范围的量化级别。151邻域q 4-邻域 q D-邻域q 8-邻域 152：像素p(x,y)的4邻域是(x+1,y)，(x 1,y)，(x,y+1)，(x,y 1)。记为。：像素p(x,y)的D邻域是(x+1,y+1)，(x+1,y1)，(x1,y+1)，(x1,y1)。记为。153：像素p(x,y)的4个4-邻域近邻像素加上4个对角邻域像素合起来构成p的8-邻域，记为。154155（一）像素的邻接：两个像素邻接的两个必要条件是：1.两个像素的位置在空间上是否接触；2.两个像素的灰度值是否满足某个特定的相似性准则（例如它们的灰度值相等，或在同一个灰度值集合V中取值）。156令
36、V是用于定义邻接性的灰度值集合。在二值图像中，如果把具有1值的像素归入邻接的，则V=1。在灰度图像中，概念是一样的，但是集合V一般包括更多的元素。157例如，对于具有可能的灰度值在0到255范围内的像素的邻接性，集合V可能是这256个值的任何一个子集。考虑三种类型的邻接性，p,q为特殊像素。4-邻接、8-邻接、m-邻接（混合邻接）。158q4-邻接的定义：如果q在集合N4(p)中，则具有V中数值的两个像素p和q是4-邻接的。159q8-邻接的定义：如果q在集合N8(p)中，则具有V中数值的两个像素p和q是8-邻接的。160qm-邻接（混合邻接）的定义：对于具有V中数值的两个像素p和q，如果满足
37、：1.q在集合N4(p)中；2.q在集合ND(p)中；N4(q)N4(p)中没有来自V中数值的像素。注意：和两个条件必须同时满足。161m邻接非m-邻接满足以上两个条件，则称具有V中数值的这两个像素q和p是m-邻接的，消除了8邻接的二义性。162 8邻接像素m-邻接像素像素的排列163（三）像素的连通：在像素的基础上，可进一步讨论和定义像素的。为讨论连通先来定义两个像素间的。164从具有坐标(x,y)的像素p，到具有坐标(s,t)的像素q的，其坐标为：(x0,y0),(x1,y1),.,(xn,yn)其中(x0,y0)=(x,y)和(xn,yn)=(s,t)，n是通路的长度。165可以由邻接类
38、型定义4-通路、8-通路和m-通路。166令S是图像中的一个像素子集。对于S中的任何像素p，S中连通到该像素p的像素集称为S的连通分量。如果S中仅有一个连通分量，则集合S称为连通集。167关于连通集概念：如图所示的一个图像子集S，如果按照四邻接定义，那么包括2个连通分量，因此S不是一个连通集；但是如果按照8邻接定义，就只包括1个连通分量，因此S是连通集。（连通集是对图像子集来讲的）168令R是图像中的一个像素子集。如果R是连通集，则称R为一个区域。区域的概念使用了“连通性”的概念。因此，我们可以说。两个区域，如果它们联合形成一个连通集，则区域Ri和Rj称为邻接区域。定义区域邻接时，考虑4邻接，
39、8邻接和m-邻接。169170假设一幅图像包括有K个不连接的区域，即Rk,k=1,2,K，且它们都不接触图像的边界。令Ru代表所有K个区域的并集，并且令(Ru)c代表其补集。我们称Ru中的所有点为图像的前景，而称(Ru)c中的所有点为图像的背景。171区域R的边界是它自身的一个像素集合，其中的每个点具有一个或更多个不在R中的邻点，即边界是区域的界限上的点的集合。边界点之一172前述定义有时更加具体的称为区域的内边界，以便与其外边界相区分。外边界对应于背景边界。在开发追踪边界的算法时这一区别很重要。1731值区域的内边界是该区域本身，这一边界并不满足闭合通路的定义。1值区域的外边界形成了一个围绕
40、该区域的闭合通路。174175基于4邻域的内边界基于4邻域的外边界176基于8邻域的内边界基于8邻域的外边界177边缘(edge)是更深一步的概念。它是一个像素和其直接邻域的局部性质，。边界是与区域有关的全局概念，而边缘表示图像函数的局部性质。178边缘是由具有形成的。边缘的概念就是基于在进行灰度级度量时不连续点的“局部”概念。可以把边缘点连接成边缘线段。边缘和边界吻合的一个例外是二值图像的情况。微积分学中用导数描述连续函数的变化。图像函数依赖于两个变量，即图像平面的坐标。因此，描述边缘的检测算子使用偏导数。图像函数的变化可以用指向图像函数最大增长方向的梯度来表示。179。梯度方向是函数最大增
41、长的方向。在图像分析中，边缘一般用于寻找区域的边界。梯度方向（与边缘方向垂直）上的边缘剖面对于边缘具有典型性。180181182：边缘最大灰度变化处；：边缘在其朝向上的倾斜程度；：分属边缘两边像素的灰度均值；：边缘两边灰度均值间的差（反映了不连续或局部突变的程度）。183184185像素之间距离函数的定义：1.欧氏距离；2.D4距离（城市距离）；3.D8距离（棋盘距离）。186给定3个像素p，q，r，坐标分别为(x,y)，(s,t)，(u,v)，如果下列条件满足的话，称函数D是距离函数或度量。)当且仅且0),(0),(qpqpDqpD),(),(pqDqpD),(),(),(rqDqpDrp
42、D187距离总是正的（两像素相同，距离为零）。距离与起、终点无关。两像素最短距离沿直线。188p和q之间的欧基里德距离定义为：这个距离，是具有与(x,y)距离小于等于某个值r的那些像素，或是包含在以(x,y)为圆心以r为半径的圆环中的那些点。22E)()(),(tysxqpD189城区（city-block）距离：具有与(x,y)距离小于等于某个值 r 的那些像素形成一个菱形。例如距点(x,y)的D4距离小于等于2的像素形成下列轮廓。),(4tysxqpD190具有D4=1的像素是(x,y)的4-邻域：191棋盘（chessboard）距离：具有D8=1的像素是(x,y)的8-邻域。D8距离小
43、于r的像素围成一个矩形。),(max),(8tysxqpD192pqpqpq193p和q之间的D4和D8距离与任何通路无关，通路可能存在于各点之间，因为这些距离仅与点的坐标有关。然而，如果选择m-邻接，则两点间的Dm距离由点间最短的通路定义。194考虑值为1的像素邻接，V=1。考虑一下p到p4的。1951961.介绍在本书中所用的各种数学工具；2.通过把它们用于各种基本图像处理任务来介绍如何使用这些工具。197包含一幅或多幅图像的阵列操作是以逐像素为基础执行的。图像可以等价地被看成是矩阵。图像间的操作是用矩阵理论执行的。与操作间的区别必须搞清楚。198考虑下面的22图像：22211211aaa
44、a22211211bbbb和 22222121121211112221121122211211bababababbbbaaaa222212212122112122121211211211112221121122211211bababababababababbbbaaaa阵列相乘矩阵相乘199：p当对一幅图像的求幂时，意味着每个像素均进行求幂操作；p当一幅图像除以另一幅图像时，意味着在相应的像素对之间进行相除，等等。200图像处理方法的最重要分类之一是它是线性的还是非线性的。考虑一般的算子H，该算子对于给定的输入图像f(x,y)，产生一幅输出图像g(x,y)：(,)(,)H f x yg x y
45、201(,)(,)(,)(,)(,)(,)iijjiijjiijjH a f x ya fx ya H f x ya Hfx ya g x ya gx yH是一个线性算子 202 32201f74562f和a11a21 026563max(1)(1)max2234724 0265(1)max(1)max3(1)742347 203图像间的，在f和g中相应的像素对之间执行操作。(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)(,)s x yf x yg x yd x yf x yg x yp x yf x yg x yv x yf x yg x y204(,)(,)(,)g x
46、 yf x yx y),(1),(1yxgKyxgiKi ),(),(yxfyxgE),(221),(yxgkyx),(),(1yxyxgK 噪声是不相关的，并且其均值为零。图像是通过对K幅不同的噪声图像进行平均形成的。(,)g x y2055102050100206207 模板图像活体图像差值图像增强后的差值图像图像相减在医学上成功的和高受益的应用：(,)(,)(,)g x yf x yh x y血管结构实际带阴影图像208图像相乘（或相除）的一种重要应用是阴影校正。(,)h x y(,)(,)(,)g x yf x yh x y(,)(,)(,)g x yf x y h
47、x y完美图像209 210211 原图像原图像的补集原图像常数图像212：非A：(A)与(B)：(A)或(B)：(A)与非(B)：(A)异或(B)XOR（异或）操作的结果：该结果是属于AB的的集合，但的的集合。逻辑操作213空间操作直接在给定图像的像素上执行，我们把空间操作分为三大类：1.单像素操作；2.邻域操作；3.几何空间变换。214单像素操作是以灰度为基础改变单个像素的值。()sT z215令Sxy代表图像f中以任意一点(x,y)为中心的一个邻域的坐标集。216该像素的值是Sxy中像素的平均值),(1),(),(crfmnyxgxyScr使用邻域处理的局部平均结果217多光谱图像处理
48、是使用向量和矩阵操作的典型领域。三幅R G B 分量图像中的相应像素值形成一个向量。218前面我们讨论的图像处理方法都是直接在图像像素上进行操作，即直接工作在空间域。在有些情况下，通过变换输入图像来表达图像处理任务，在变换域执行指定的任务，之后再用反变换返回到空间域会更好。219一般情况下，我们用T(u,v)表示一个二维线性变换的结果，其中f(x,y)是输入图像，。下式对u=0,1,2,M-1和v=0,1,2,N-1进行计算。x和y是空间变量，M和N是f的行和列，u和v称为变换变量。1100(,)(,)(,)MNxyT u vf x y r x y u v220给定T(u,v)后，我们可以用T
49、(u,v)的反变换还原f(x,y)，其中x=0,1,2,M-1和y=0,1,2,N-1，。以上两个公式一起称为变换对。1100(,)(,)(,)MNuvf x yT u v s x y u v2212222()2()(,)1(,)vyuxjMNvyuxjMNr x y u ves x y u veMN112()00112()00(,)(,)1(,)(,)MNvyuxjMNxyMNvyuxjMNuvT u vf x y ef x yT u v eMN正变换核反变换核离散傅里叶变换对223被正弦干扰污染的图像傅里叶变换的幅度用于消除能量脉冲的模板（滤波器）傅里叶反变换的结果干扰能量脉冲：空间域中的正弦干扰在变换域以出现。224在开发图像处理算法中，概率的概念起着核心角色的作用。概率以很多方式用于图像处理工作中。当我们以随机量处理灰度值时，例如，令zi，i=0,1,2,L-1表示一幅MN大小数字图像中所有可能的灰度值，则在给定图像中灰度级出现的概率可估计为下式，其中是灰度在图像中出现的次数，MN是像素总数。()kknp zMN10()1Lkkp z22510()Lkkkmz p z1220()()Lkkkzmp z平均灰度灰度的方差2262=204.3低对比度2=997.8中对比度2=2424.9高对比度227

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：数字图像处理-课件-2.pptx
链接地址：https://www.163wenku.com/p-4446004.html

晟晟文业

内容提供者

实名认证

联系作者