数字图像处理-课件-2.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数字图像处理-课件-2.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 课件 _2
- 资源描述:
-
1、12要想成功,就必须弄清基础问题。亚里士多德 3p 2.1节简述人类视觉系统的机理。p 2.2节讨论光、电磁波谱的其他分量及它们的成像特点。p 2.3节讨论成像传感器及怎样使用它们产生数字图像。p 2.4节介绍均匀图像取样及灰度量化的概念。p 2.5节介绍像素间的各种基本关系。p 2.6节介绍本书用到的主要数学工具。45睫状小带视轴玻璃体中央凹盲点神经和鞘前房6上图显示了人眼的一个简化水平剖面。眼睛的形状近似为一个球体,其平均直径约为20mm。有三层薄膜包围着眼睛:1、角膜是一种硬而透明的组织,覆盖着眼睛的前表面。2、巩膜与角膜相连,巩膜是一层包围着眼球其余部分的不透明的膜。73、脉络膜位于巩
2、膜的正下方。4、脉络膜的最前面分为睫状体和虹膜。5、虹膜的收缩和扩张控制着进入眼睛的进光量。虹膜中间的开口(瞳孔)的直径是可变的,范围大约在28mm。6、晶状体由同心的纤维细胞层组成,并由附在睫状体上的纤维悬挂着。87、眼睛最里面的膜是视网膜,它布满了整个后部的内壁。当眼睛适当地聚焦时,来自眼睛外部物体的光在视网膜上成像。由视网膜表面分布的不连续的光感受器提供了图案视觉。有两类光感受器:和。9每只眼睛中的。它们主要位于视网膜的中间部分,称之为,且对颜色高度敏感。通过这些锥状体,人可以充分地分辨图像细节。视觉称为或。10。杆状体用来给出视野内的一般的总体图像。它们没有彩色感觉,而对低照明度敏感。
3、视觉称为或。1112中央凹本身是视网膜中直径约为1.5mm的圆形凹坑。我 们 可 以 把 中 央 凹 看 成 是 大 小 为1.5mm1.5mm的方形传感器阵列。在视网膜这一区域中,锥状体的密度大约为15万个/mm2。基于这一近似,眼睛中最高敏感区域中央凹的锥状体数量约为33.7万个。从自然分辨能力的角度看,恰好与一个中等分辨率的电荷耦合元件CCD成像芯片具有的元素数量相当,接收器阵列不大于5mm5mm。13顶尖学术期刊Cell2019年2月21日新出炉的一期,封面格外吸引人的“眼球”:我们人类的一位大兄弟正聚精会神地“看”着什么人类的视觉出类拔萃,比如我们能够阅读,分辨人脸。这些功能可不简单
4、,需要视觉能够分辨极细微的差异,并能迅速对焦。,也就是眼底黄斑的中心。中央凹的直径不到1.5毫米,面积只占视网膜的不到1%,但大脑获得的视觉信息却有50%来自这里。14中央凹的特殊,还不仅是因为视线的“焦点”落在此处提供清晰影像,只有部分灵长类生物进化出了这个结构,比如人类。中央凹处的细胞检测到表达与外周不一样的基因。非常有意思的是,科学家们相信,可能这才是中央凹功能特殊的原因。1516在普通照相机中,镜头有固定的焦距,各种距离的聚焦是通过改变镜头和成像平面间的距离实现的,。在人眼中,则与此相反。晶状体和成像区域(视网膜)之间的距离是固定的,睫状体中的纤维可实现这一功能,在远离或接近目标物时纤
5、维会分别变扁或加厚晶状体。17h表示视网膜图像中物体的高度h=2.55mm151000.017h18视网膜图像主要聚焦在中央凹区域。然后,光接收器的相对刺激作用产生感知,把辐射能转变为电脉冲,最后由大脑解码。失明的原因有很多,不过其中之一就是视网膜的视锥和视杆细胞发生了病变,无法顺利使光信号转变为电信号。这些光感受器细胞如果不能行使正常的功能,即使眼睛的其他部分都是健康的,也不能够产生有质量的视觉。19视网膜中的光感受器一旦损伤或退变,由于不能自行修复,往往会导致失明。如果能够使用人工光感受器来替代原有的视网膜功能,对于黄斑变性等疾病的患者来说,将是巨大的希望。来自复旦大学的研究团队开发了一种
6、“人工视网膜”,这是一种。研究人员将之植入失明小鼠的眼底,成功使得小鼠的视觉得到了恢复。20相关研究题为Nanowire arrays restore vision in blind mice,2018年3月6日发表在Nature Communications上。这种光感受器使用的是金/氧化钛纳米线阵列,阵列由二氧化钛纳米线组成,上面用金纳米颗粒修饰。21研究人员将这种“人工视网膜”植入了小鼠的眼底。当接收光照射时,小鼠的瞳孔会缩小,视网膜中的神经节细胞恢复了对光的响应。神经节细胞能把视觉信号经视神经向大脑视觉中枢传递。这是由于纳米线阵列吸收光线后,产生光电压并触发附近神经元的电活动,从而恢复
7、小鼠对光的敏感性。22这种纳米线光感受器有效地替代了原有视网膜中的视杆细胞和视锥细胞,因而,在植入后能够观察到视觉中枢的神经元也恢复了对光的响应,同时,瞳孔对光的反射也有所改善。这种新一代为黄斑变性等视网膜疾病提供了一个新的治疗选择:通过人工光感受器的植入,帮助患者恢复对视觉的响应。2324中国科学技术大学生命科学与医学部与美国马萨诸塞州州立大学医学院合作,结合视觉神经生物医学与创新纳米技术,首次实现动物裸眼红外光感知和红外图像视觉能力。该研究成果于2019年2月28日在线发表于国际顶级期刊Cell上,并被Cell杂志选为本期唯一科普视频进行重点推广。25能被我们眼睛感受的可见光只占电磁波谱里
8、很小的一部分,。在生物进化历程中,没有出现任何基于感光蛋白的,能够感知超过700nm的红外光的动物感光细胞,更无法在大脑中形成红外光图像视觉。26为解决上述问题并发展裸眼无源红外视觉拓展技术,尝试利用一种,导入动物视网膜中以实现红外视觉感知。在视网膜下腔注射pbUCNP纳米颗粒的小鼠不仅获得感知红外线的能力,还可以分辨复杂的红外图像。在获得红外视觉的同时,小鼠的可见光视觉没有受到影响。27这项技术不仅能赋予我们超级视觉能力,通过开发具有不同吸收和发射光谱参数的纳米材料,还有可能辅助修复视觉感知波谱缺陷相关疾病,例如红色色盲。2829因为数字图像作为离散的灰度集来显示,所以眼睛对不同亮度级别之间
9、的辨别能力在显示图像处理结果中是一个重要的考虑因素。30人的视觉系统能够适应的光强度级别范围是很宽的从暗阈值到强闪光约有1010个量级。实验数据指出,主观亮度(即由人的视觉系统感知的亮度)是进入人眼的光强的对数函数。31 32 视觉系统往往会在不同强度区域的边界处出现“下冲”或“上冲”现象。马赫带:厄恩 斯 特 马赫于1865年首次描述了这一现象。33感知区域的亮度并不简单地取决于其强度。所有的中心方块都有相同的强度,但是当背景变亮时,它们就逐渐变暗。34在错觉中,眼睛填充了不存在的信息或者错误地感知了物体的几何特点。353637彩色光的电磁能谱跨越0.43m()-0.79m()的范围。38人
10、感受物体的颜色由物体反射光的性质决定。以所有可见波长相对平衡地反射光的物体,对观察者而言是白色的。一个物体在可见光谱的有限范围内反射时会呈现各种颜色色调。例如,绿色物体反射波长范围为500570nm的光,而吸收其它波长的大部分能量。39没有颜色的光称为单色光或无色光。单色光的唯一属性是它的强度或大小。单色光的强度:黑色灰色白色。从黑到白的单色光的度量值范围通常称为灰度级,而单色图像常称为灰度图像。40有三个基本量用于描述彩色光源的质量:发光强度、光通量和亮度:是从光源流出能量的总量,通常用瓦特(W)来度量。(lm):用流明数度量的光通量给出观察者从光源感受到的能量。:是光感知的主观描绘子,它实
11、际上不能度量。它具体体现了强度的无色概念,是描述彩色感觉的参数之一。41 原理上,如果可以开发出一种传感器来检测由一种电磁波谱发射的能量,那么我们就可以在该波段上对感兴趣的事件成像。但要注意的一点是,要求“看到”一个物体的电磁波的波长必须小于等于物体的尺寸。42p成像以电磁波发射的能量为基础;p物体反射的声波也可用于形成超声波图像;p电子显微镜的电子束成像;p用于图形与可视化的合成图像。4344我们感兴趣的多数图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收而产生的。照射可以由电磁波谱的能源引起。场景元素可能是熟悉的物体,也可以是分子、沉积岩或人类的大脑。45依赖光源的特性,照射
12、被物体反射或透射。p第一类例子是从平坦表面反射。p第二类例子是为了产生一幅X射线照片,让X射线透过病人的身体。46将照射能量变换为数字图像的传感器配置:p通过将(电磁波谱的某个谱段)相组合,把输入能源转变为电压。p输出电压波形是传感器的响应,通过把传感器响应数字化,从每一个传感器得到一个数字量。472009年度诺贝尔物理学奖授予:美国科学家威拉德S博伊尔(Willard S.Boyle)和乔治E史密斯(George E.Smith)48威拉德S博伊尔和乔治E史密斯因为1969年发明了获此殊荣。这一发明使得数码相机、带有摄像头的手机等电子设备风靡全球,人类已经进入了全民数码影像的时代,每一个人都
13、可以随时、随地、随意地用影像记录每一瞬间。49CCD图像传感器的发明,实际上是应用。但是从理论到实践,道路却并不平坦。科学家遇到的最大挑战,在于。50经过多次试验,博伊尔和史密斯终于解决了上述难题。他们采用一种高感光度的半导体材料,将光线照射导致的电信号变化转换成数字信号。它革新了摄影术,使得光可以被电子化地记录下来,取代了胶片。这一数字形式极大地方便了对图像的处理和发送。51成像物镜将外界照明光照射下的(或自身发光的)景物成像在物镜的像面上,形成二维空间的光强分布(光学图像)。能够将二维光强分布的光学图像转变成一维时序电信号的传感器称为图像传感器。52 53 线性运动54平板扫描仪航空成像5
14、5 线性运动传感器条带成像区域56 57以圆环形方式安装的传感器带用于医学和工业成像,以得到三维物体的剖面(“切片”)图像。传感器的输出必须由重建算法处理,。58每个传感器单元的响应正比于投射到传感器表面的光能总量。59固体自扫描图像传感器是20世纪70年代发展起来的新型图像传感器件,如面阵CCD器件,CMOS图像传感器件等。CCD器件按其感光单元的排列方式分为线阵CCD和面阵CCD两类。60这类器件本身具有自扫描功能,例如。电荷图像在驱动脉冲的作用下按照一定的规则一行行地输出,形成图像信号。61结构简单,成本较低。可以同时储存一行电视信号。由于其单排感光单元的数目可以做得很多,在同等测量精度
15、的前提下,其测量范围可以做的较大。并且由于线阵CCD实时传输光电转换信号和自扫描速度快、频率响应高,能够实现动态测量,并能在低照度下工作。62所以线阵CCD广泛地应用在产品尺寸测量和分类、非接触尺寸测量、条形码等许多领域。线阵CCD的优点是一维像元数可以做得很多,而且像元尺寸比较灵活,帧幅数高,特别适用于一维动态目标的测量。63对于面阵CCD来说,应用面较广,如面积、形状、尺寸、位置,甚至温度等的测量。面阵CCD的优点是可以获取二维图像信息,测量图像直观。缺点是像元总数多,而每行的像元数一般较线阵少,帧幅率受到限制。64由于生产技术的制约,单个面阵CCD的面积很难达到一般工业测量对视场的需求。
16、线阵CCD的优点是分辨力高,价格低廉,但要用线阵CCD获取二维图像,必须配以扫描运动,而且为了能确定图像每一像素点在被测件上的对应位置,必须配以光栅等器件以记录线阵CCD每一扫描行的坐标。65p彩色线阵CCD图像传感器p分辨率:4096p像元尺寸:10m10mp帧频:4通道,23.7fpsp时钟:425MHzp动态范围:70dB66p黑白/彩色全帧CCD图像传感器p分辨率:40085344p像元尺寸:9m9mp帧频:4通道,3.6fpsp时钟:425MHzp动态范围:72dB,线性67输出数字图像CCD成像芯片的图像平面场景光源成像系统数字图像获取过程68我们用形如f(x,y)的二维函数来表示
17、图像。在空间坐标(x,y)处,f的值或幅度是一个正的标量,其物理意义由图像源决定。当一幅图像由物理过程产生时,其亮度值正比于物理源(如电磁波)所辐射的能量。因此,f(x,y)一定是非零的和有限的,即 0f(x,y)69函数f(x,y)可由两个分量来表征:p(1)入射到被观察场景的光源照射总量;p(2)场景中物体所反射的光照总量。这两个分量分别称为入射分量和反射分量,且分别表示为i(x,y)和r(x,y)。两个函数作为一个乘积合并形成f(x,y)。70(,)(,)(,)f x yi x y r x y0(,)i x y 0(,)1r x y对于X射线成像,用透射系数代替反射函数。71令单色图像在
18、任何坐标(x0,y0)处的强度(灰度)表示为,则l的取值范围为。区间称为灰度级(或强度级)。实际情况下常常令该区间为,其中为黑色,为白色。所有中间值是从黑色到白色之间变化的灰度色调。72计算机图像处理所使用的数字图像函数通常表示成矩阵的形式,因而其坐标是整数。图像函数的定义域是平面的一个区域 R。其中xm,yn表示最大的图像坐标。nmyyxxyxR1,1),(7374各种获取图像的方法的目的是就是从感知的数据生成数字图像。多数传感器的输出是连续的电压波形,这些波形的幅度和空间特性都与感知的物理现象有关。为了产生一幅数字图像,我们需要把连续的感知数据转换为数字形式。这种转换包括两种处理:和。75
19、为了用计算机来处理图像,图像必须用适当的离散数据结构来表达,例如,矩阵。传感器获取的图像是平面上两个坐标的连续函数f(x,y)。图像数字化是指将f(x,y)采样(sampled)为一个M行N列的矩阵。76图像量化(quantization)给每个连续的样本数值f一个整数数字。图像函数f(x,y)的连续范围被划分为K个区间。采样及量化越精细(即M,N,K越大),对连续函数的近似就越好。77p一幅图像的x和y坐标及幅度可能都是连续的。p为将它转换为数字形式,必须在坐标上和幅度上都进行取样操作。78有两个与图像采样有关的问题需要确定:1.其一是采样的间隔,即相邻两个采样图像点的距离,2.其二是采样点
20、的几何排列(采样栅格)。79一个连续的图像函数f(x,y)可以用平面上离散的栅格点来采样。图像的采样点是:x=ix,y=jy,i=0,M-1,j=0,N-1。两个相邻的采样点在x轴上相差x,在y轴上相差y。距离x和y为(x或y轴上的)采样间隔(sampling interval)。80采样的矩阵f(ix,jy)构成了离散图像。规格化栅格上的理想采样s(x,y)可以用一组狄拉克分布来表示:1010),(),(MiNjyjyxixyxs81采样后的图像fs(x,y)是连续图像函数f(x,y)和采样函数s(x,y)的乘积:公式中的狄拉克分布组合可以看作是周期为x和y的周期函数并展开为傅立叶级数。10
21、10),(),(),(),(),(MiNjsyjyxixyxfyxsyxfyxf82(,)(,)(,)sfx yf x ys x y1100(,)(,)MNxyijs x yxiyj 8384在图像分析中Shannon采样定理的一个简单的物理解释是:设已知图像中感兴趣的最小细节的尺寸,采样间隔应该比它的一半要小。在实际的数字转换器中采样函数不是狄拉克分布,而是有限冲击函数。85一个连续图像在采样点处被数字化。这些采样点是在平面上排列的,称它们之间的几何关系为栅格。栅格一般是方的。因此数字图像是一个数据结构,通常是矩阵。86栅格中一个无限小的采样点对应数字化图像中的一个像元或称像素(pixel)
22、;全体像素覆盖了整个图像,实际的数字转换器捕捉的像素具有有限的尺寸,这是因为采样函数不是一组理想的狄拉克冲激,而是一组有限冲激。87从图像分析的角度看,像素是不能再分割的一个单位。我们也常用一个“点”来指一个像素。888990在图像处理中,采样的图像数值fs(ix,jy)用一个数字来表示。为了使人能够觉察出图像的细微变化,量化的级别要足够的高。91大部分数字图像处理仪器都采用L个等间隔的量化方式。如果用k位来表示像素亮度的数值,那么亮度阶就是L=2k。92通常采用每个像素8位的表示方式,也有采用6位或4位。二值化图像,可以用1位来表示像素。有时也使用12位或更多位来表示一个像素。93 94连续
23、图像投影到传感器阵列 图像取样和量化的结果9596979899有三种基本方法表示f(x,y):1.用两个坐标轴决定空间位置,第三个坐标是以两个空间变量x和y为函数的f值(灰度值);2.显示f(x,y)出现在监视器或照片上的情况;3.将f(x,y)的数值简单地显示为一个阵列(矩阵)。100画为表面图形的图像显示为可视灰度阵列的图像显示为二维数值阵列的图像101(0,0)(0,1)(0,1)(1,0)(1,1)(1,1)(,)(1,0)(1,1)(1,1)fffNfffNf x yf Mf Mf MN图像的MN的数值阵列表示1,11,10,11,11,10,11,01,00,0NMMMNNaaaa
24、aaaaaA图像的矩阵表示102数字图像的原点位于左上角,其中正x轴向下延伸,正y轴向右延伸。这种方便的表示基于这样的事实:许多图像显示(譬如电视显示器)扫描都是从左上角开始扫描第一行,然后向下移动一行,继续逐行扫描。更重要的事实是矩阵的第一个元素按惯例应在阵列的左上角。因此,将f(x,y)的原点选择在左上角于数学上是讲得通的。103原点在左上角,纵坐标垂直向下,横坐标水平向右。104数字化过程要求针对M值、N值和离散灰度级数L做出判定:pM和N:必须取正整数;pL:L2k 105 图像系统的动态范围定义为与。作为一条规则,上限取决于饱和度,下限取决于噪声。基本上,动态范围由。因此,也是图像的
展开阅读全文