书签 分享 收藏 举报 版权申诉 / 117
上传文档赚钱

类型第一章-数字图像处理基础课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2927419
  • 上传时间:2022-06-12
  • 格式:PPT
  • 页数:117
  • 大小:4.26MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第一章-数字图像处理基础课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第一章 数字图像 处理 基础 课件
    资源描述:

    1、第一章第一章 数字图像处理基础数字图像处理基础2014年11月课堂授课、项目与实验安排n课堂授课,课堂授课,36学时学时w第一章 数字图像处理基础(5学时)w第二章 图像变换(4学时)w第三章 图像增强(9学时)w第四章 图像复原(5学时)w第五章 图像分割(5学时)w第六章 彩色图像处理(4学时)w习题分析与讨论(4学时)n项目与实验,项目与实验,4(课内)(课内)+4(课外)学时(课外)学时w项目,见项目,见数字图象处理数字图象处理课程项目实施方案课程项目实施方案n项目名称:面部自动定位n实施模式: 4-5人一组合作完成项目n考核方式:项目:成果检查 50%,项目报告50%w实验,实验,6

    2、个实验,见实验指导书个实验,见实验指导书(选做选做)考核方式n平时(出勤、课堂讨论、课后作业): 10%,项目与实验: 30%, 考试: 60%教材、参考书目n首选教材:数字图像处理,自编讲义,2012n二选教材:K.R. Castleman, 数字图像处理, 电子工业出版社,2011n参考书目:(1) R.C.Gonzalez,数字图像处理(第3版),电子工业出版社,2011;(2) W.K.Pratt,数字图像处理(原书第4版),机械工业出版社,2010什么是数字图像处理?数字图像处理(Digital Image Processing)是一个迅速发展的专业领域。它的主要目的是将图像信号转换

    3、成数字信号并利用计算机对其进行处理和加工,以便提取图像中的信息。这是什么图这是什么图像像?图像?图像?这玩意儿,你不问我还清楚这是什么;你要真问起来,我反倒不知道该如何解释它了。卡斯尔曼:一幅图像就是指某些事物的表示,并包含关于目标的描述性信息。你会如何定义?众所周知的事情正因为众所周知的事情正因为众所周知而不为人所知众所周知而不为人所知图像的类型图像的类型图像以各种不同的形式出现:n数学上连续的、离散的是一种二维函数 f(x,y), 其中 x,y是空间(平面) 坐标,幅度f 称为亮度或灰度n物理上:某种物质或能量的分布可见的、不可见的处理处理n连续的、离散的数字图像数字图像一个2D数字化采样

    4、值的方形阵列,只有数字图像才能用计算机处理n以相等间隔采样的方形格栅模式 (光栅), 并n以等幅度间隔量化给出一些连续和离散图像处理的例子?应用需求n图像是人们获取和交换信息的主要来源,因此数字图像处理的应用领域必然涉及人类生活和工作的方方面面。技术进步n计算机计算机:不断增长的性能和不断降低的价格n图像数字化与显示设备的不断出现图像数字化与显示设备的不断出现 数字相机, 扫描仪, 视频捕获设备, CRT, LCD, 打印机, 具有的独特优势n图像数字化,以便于图像的传输、打印和存储n图像的增强和复原,改善图像质量n图像的分割和描述,获得图像的信息n大量图像的高速处理n三维及更高维图像数据的测

    5、量和显示(如遥感图像和各种内脏器官及血管形状的测量与显示)医学和生物学成像医学和生物学成像: CT, B超,磁共振工业工业: 机器视觉, 自动控制, 空间空间: 航空, 导航, 遥感 (森林, 环境,资源), 监控监控:视频监控, 牌照识别, 人脸识别,军事军事:侦察,导航,声纳成像, 艺术艺术等等电磁能量谱电磁能量谱: Gamma-射线, X-射线, 紫外,可见光, 红外, 微波, 无线电波: CT (computerized tomography), MRI (Magnetic Resonance Imaging), EIT (Electrical Impedance Tomography

    6、)声波与超声波声波与超声波: B超, 声纳电子电子: 电子显微镜计算机图形学计算机图形学根据能量源的图像分类根据能量源的图像分类:PET(positron emission tomography): 正电子射线层析术Cygnus:天鹅座Aortic angiogram:大动脉血管造影Anatomical:解剖的, 解剖学的Taxol 红豆杉醇cholesterol胆固醇Nickel oxide镍氧化物organic superconducting 有机超导Intraocular implant:眼内植入Thyroid:甲状腺, 甲状软骨Fractal:分维 输入输入Input 存储存储Stor

    7、age 处理器处理器Processor 输出输出Output26广义图像广义图像非光学图像高维图像 (包括多频谱图像)非标准采样的图像非标准量化的图像图像处理图像处理 与 图像分析图像分析图像处理是指为了能更好地观察图像或其他目的而产生一个修改了的图像图像分析把图像转换成某种非图像的形式,诸如目标的数量、类型、尺寸等计算机图形学计算机图形学: : 关于用计算机产生图像的学科计算机视觉计算机视觉: :对景物进行解释阅读n教科书n参考文献讨论n课堂、小组项目与实验nMATLAB自己动手!1.1 人眼的视觉1.2 图像获取 1.3 图像数字化1.4 数字图像表达1.5 数字图像质量30为什么要讨论

    8、?n图像的信息来源于观察。数字图像处理的目的在于提供与观察者的视觉能力相匹配的图像输出,以便于观察者理解和解释图像的内容,提取图像信息。n人们从外界所获取的信息中有80%是通过视觉获得的。通过HVS,人们能感知外界物体的大小、形状、颜色、明暗、动静和远近等。数字图像处理是从模拟人类的视觉开始的。尽管数字图像处理系统已可以完成相当多的工作,但其性能比起HVS来说还差得很远。n理解人类视觉特性,有助于开发模拟人眼视觉过程的模型,并对图像处理系统的设计具有重要的指导作用。31通过人眼所形成的图像包括物理范畴的像和心理范畴的像:即来自外界物体的光线,通过人眼的折光系统在视网膜上所形成的物象,它与外界物

    9、体通过照相机中的透镜组在底片上成像并无原则上的区别;而来自视网膜的神经信息,则通过人脑的神经信息处理在视觉中枢内形成主观意识上的映像。以下分别从视觉生理和心理两个方面来讨论人眼的视觉特性。32左图是人的右眼水平切面结构图。眼内与产生视觉直接有关的结构是眼睛的折光系统和感光系统。折光系统由角膜、房水、晶状体和玻璃体组成。视网膜含有对光刺激高度敏感的视杆细胞视杆细胞和视锥细胞视锥细胞,能将外界光刺激所包含的视觉信息转变成电信号,并在视网膜内进行编码、加工,再由视神经传向视觉中枢作进一步分析,最后形成视觉。视杆细胞视杆细胞(Rod Cell)在光线较暗时活动,有较高的光敏度,但不能作精细的空间分辨,

    10、且不参与色觉。在较明亮的环境中以视锥细胞视锥细胞(Cone Cell)为主,它能提供色觉以及精细视觉。(亮视觉和暗视觉)颜色视觉是指对不同颜色的识别,即不同波长的光线作用于视网膜后在人脑引起不同的主观映像。正常视网膜可分辨波长380-760nm之间的上百种不同的颜色,每种颜色都与一定波长的光线相对应。视网膜中并不存在上百种对不同波长起反应的视锥细胞。早在19世纪初期,Young和Helmholtz就提出了三原色理论。该理论认为在视网膜上分布着三种不同的视锥细胞,分别含有对红、绿、蓝三种光敏感的视色素。当某一波长的光线作用于视网膜时,可以一定的比例使三种视锥细胞分别产生不同程度的兴奋,这样的信息

    11、传至中枢,就产生某一种颜色的感受。33近年来,通过实验确定,在视网膜中存在三种基本类型的视锥细胞。这些视锥细胞具有不同的吸收特征,该特征是波长的函数,在光谱的红、绿和蓝区域具有峰值吸收。存在三种视锥细胞,这为彩色视觉的三原色理论提供了生理机能的基础。当光刺激激活一个视杆细胞或视锥细胞,就发生一个感光换能反应,产生一个神经脉冲。神经脉冲通过视觉系统传播的方式至今还不是十分清楚。知道的是视神经束包含800000量级的神经纤维。34三种锥状细胞的相对视敏函数曲线相对视敏函数曲线视觉心理是指外界视觉刺激带来的感觉、知觉、认知等人内心的各种情感形式。外界的各种事情经由视觉系统接受后,其反应在很多情形下与

    12、外界的物理特性不一定相同。对于图像、风景的主观视觉反应,由于经过高层次复杂反应的合成,因而变得非常复杂。以下介绍几种效应或效果。35Scotopic: 暗视的,暗视的,rods视杆细胞;视杆细胞; Photopic:明视觉的明视觉的, cones视锥细胞视锥细胞韦伯比(韦伯比(Web ratio)B/B: 大约为大约为 2%,但在暗和亮的区,但在暗和亮的区域该值升高。域该值升高。38在亮度突变处,视觉的主观感受出现虚幻的亮或暗的条纹。因Mach效应而对人眼所见景物有增强其轮廓的作用。39从信号处理的角度, 这是一个什么滤波器?神经丛神经丛对于闪烁的光源,当闪烁频率增大到某一数值的时候,就能感觉

    13、到它是连续光源,这种现象叫闪烁融合,这时的频率叫闪烁融合频率(简称闪频值)。由于帧率大于CFF,运动图像看起来就是连续的讨论讨论:TV(PAL, NTSC), HDTV、电影等、电影等的帧率的帧率?人眼视觉暂留效应人眼视觉暂留效应(0.05-0.2秒秒 ) 42434445对比对比效应效应,一方使另一方向自己相反性质或程度方向变化的效果。诱导效诱导效应应,有多个对象时,一方对另一方、量多者对量少者(或者相反)施加影响而产生的知觉。在图像显示中如何利用?也可以考虑作为补充或强调等特殊手段来使用。46相同亮度的目标物(方块)放在不同亮度的背景上,给人眼的亮度感觉是不同的。这种效应是由背景的不同引起

    14、的。在照明光源中的应用?白平衡?47波长敏感接收器的输出馈入到一种代表人眼光学部分的低通线性系统低通线性系统H1,后面跟随着一个表示视杆或视锥细胞的非线性强度响应的一个单单调非线性系统调非线性系统,接着横向抑制过程通过一个具有带通响应的线性系统带通响应的线性系统H2来描述,而人眼神经暂存响应限制引起的延迟和滞后则由一个线性线性时间传递函数时间传递函数H3来模型化。 根据成像原理和方法的不同,可分成数字图数字图像像(例如数码照片、CT图像)和模拟图像模拟图像(例如TV图像和X光片);本节主要讨论模拟图像输入到计算机中的图像获取技术。图像获取装置按其有无机械扫描、有无透镜和滤色镜等光学系统、摄像器

    15、件种类等要素进行组合,有多种方式。常用的图像获取方式有利用扫描仪和利用摄像机的两种。 扫描仪就是能够把照片、图画以及写在纸上的原稿等二维图像分解成一维像素串,并将像素的光信号转换为电信号的装置。每个像素由光信号变换为电信号的过程称为光电变换。传真机和电子式复印机的输入,与图形扫描仪同样,都利用扫描和光电变换。扫描在历史上有过各种各样的方法,大体上可分为机械式和电子式两类。机械式的一个实用化例子是图1-7所示的平台扫描方式和圆筒扫描方式。 相机是目前应用领域和应用范围最广的图像获取手段。相机的主要成像器件有CCD和CMOS两种图像传感器。基本成像过程都包括光电转换、电荷收集、信号转换与输出等步骤

    16、。现在的数码相机通常都可拍摄静止图片和运动视频。集成有成像芯片和DSP板卡的数码相机和摄影机能够直接输出数字信号,只要选用合适(计算机支持)的数字接口(例如网络、USB、IEEE1394等),就可以输入到计算机中。在某些需要实时完成高速、大数据量的视频图像采集的应用中,往往需要借助视频/图像采集卡将摄像机输出的图像信号采集到计算机中。基于相机和采集卡的方式,不像扫描仪中有固定的照明,摄取对象大多是实际景物,光照条件易发生变化。 一个量化采样值的 2D方形阵列n什么是数字化 ?n如何数字化 ?n性能与指标n数字化及其组成把图像从其原来的形式转换成数字形式什么是图像的数字形式 ?图像的数字形式图像

    17、的数字形式: 0-D5图像的数字形式图像的数字形式 : 1-D5 6 6 6 6 5 4 4 3 2 1图像的数字形式图像的数字形式 : 2-D5 6 6 6 6 5 4 4 3 2 1 5 6 6 6 6 5 4 4 3 2 1 5 6 6 6 6 5 4 4 3 2 1 5 6 6 6 6 5 4 4 3 2 1f(1,5) = 6Raster scanning光栅扫描如何数字化如何数字化 ?如何数字化?如何数字化?假设模拟图像f(x,y)的f表示灰度,其数值称作灰度值。采样:是从连续空间(x,y)中获取灰度值f的样本的操作。量化:将样本的灰度由实数向整数进行变换表达的操作(模数转换)扫描

    18、:实际进行采样、量化的顺序和方法。(图像内像素位置的寻址)1.3.2 采样采样采样格子间隔越小,图像就越清晰;缩小采样间隔,图像尺寸在变大的同时数据量也将迅速增加。采样定理采样定理模拟信号f(x)不含有比max更高的频率成分时,与x相关的间隔为(1/(2max))的f(x)样本值序列可以完全决定f(x)。max12Nyquistx关于采样的进一步讨论关于采样的进一步讨论n采样函数 x=mx, y=ny (m, n =0, 1, 2, )采样函数定义:oxyyx mnynyxmxyxs),(),(关于采样的进一步讨论关于采样的进一步讨论设 f(x,y)原图像; fs(x,y)采样后图像则: fs

    19、(x,y) f(x,y) s(x,y)分别作傅立叶变换,令: f(x,y) F(u,v);s(x,y) S(u,v); fs(x,y) Fs(u,v)有: Fs(u,v) = F(u,v) * S(u,v) mnsddvnvumuFyxvuF),(),(1),(关于采样的进一步讨论关于采样的进一步讨论根据卷积定理,及 u = 1/x; v = 1/y有: mnsynvxmuFyxvuF),(1),(说明:说明:采样图像的频谱是原始连续图像频谱在空间域上的无限重复,周期为: 1/x(u方向), 1/y (v方向)关于采样的进一步讨论关于采样的进一步讨论),(vuFuv),(vuFsuvxu1yv

    20、1设原始图像是有限带宽的,即:设原始图像是有限带宽的,即: , 0| ,| , 0),(其它cccVvUuvuF适当选取适当选取x,y ,可,可Fs(u,v)相邻周期频谱互不重叠相邻周期频谱互不重叠.采样图像失真采样图像失真图像失真当采样间隔大于奈奎斯特当采样间隔大于奈奎斯特间隔(间隔(x(1/(2max))时,)时,由于比由于比1/2采样频率高的频采样频率高的频率成分折返混入低频域,率成分折返混入低频域,所以称作折叠噪声所以称作折叠噪声(folding noise)。由于在与原本存在的频率由于在与原本存在的频率不同的频率中混叠不同的频率中混叠(alias)产产生该信号,该现象称为图生该信号,

    21、该现象称为图像 失 真 或 混 叠 现 象像 失 真 或 混 叠 现 象(aliasing)。对于具有周期性构造的图像,在用与该周期性构造具有一定几何关系的采样格子进行采样时,将会产生波纹图案(moire pattern)或莫尔条纹(moire fringes)。如图所示的图例中,可以看到原本图像中不存在的墙壁面的周期性条纹。波纹图案波纹图案采样后得到的图像样本值,仍为连续值。在分级量化中,提取样本的连续值变换为离散值。分级量化的数值一般称作量化级,在图像数字化处理中也称为灰度级或像素值。由于计算机使用二进制,灰度级Q为2n时,称作n比特量化级。例如,在256量化级数情况下,叫做8比特量化级。

    22、这时,各像素按8比特表示灰度级,所以该像素也称为8比特像素。均匀量化把原图像灰度层次从最暗至最亮均匀分为有限个层次,即:把整个取值范围r0, rk均匀地分为k个子区间ri, ri-1,i=0,1,2,k-1。K常取2n。量量 化化 输输 出出 数数 据据采样输入样本采样输入样本rq均匀量化间隔均匀量化间隔)(rpr0rkr0r1r2rkr1kr0q1q2q1kq非均匀量化量化时采用不均匀分层量量化化输输出出数数据据非均匀非均匀量化间隔量化间隔采样输入样本值采样输入样本值rq70量化误差:原灰度与量化灰度级之间的差。n由于在灰度由实数向整数进行变换操作中会产生舍入误差,所以得出与原灰度值有出入的

    23、数值。量化对象的灰度范围(dynamic range,动态范围)确定的条件下,随着量化级数增加,量化级间隔变小,使得量化误差减小。如何决定量化级数?定量分析伴随量化误差而产生的信噪比(S/N)设信号功率的峰-峰值为Sp-p、噪声功率的均方根值(RMS)为Nrms。不失一般性,假设动态范围是在将图像进行均等分级量化时产生的。将灰度设为f,一个量化级的幅度为q。如果假定q中的量化误差是一致的,则分级量化噪声功率Nq为2222112qqqqqNx dx因为分级量化噪声的平均值为0,所以Nq就是量化噪声的方差。同样,Nrms为量化噪声的标准差,所以可表示为:另一方面,量化比特数为n,灰度级数设为Q,则

    24、有因此,信噪比S/N为据此,为使得S/N在s以上,对图像进行量化时,至少要达到满足以下要求的量化级数12rmsqNNq 2np pSqQ q QqqQNSrmspp121212sQ73对于普通照片,假如设定为256级灰度(8比特,S/N=sqrt(12)*256=887),肉眼基本上不会感到照片不自然。然而,对于像胸部X线照片等动态量程大的图像,就需要达到1024级灰度(10比特,S/N=3574)。相反,设计图纸等却只需要表现出黑白两个值即可,所以这时进行2级量化就足够了。量化级数为2的图像,称为2值图像。具有更高灰度级数的图像称为多值图像或灰度图像。74虚(伪)轮廓虚(伪)轮廓75虚轮廓(

    25、灰梯度轮廓)虚轮廓(灰梯度轮廓) 在模拟图像上灰度变化平滑处,如果量化级数不充分,相邻灰度级区域所对应的量化误差将增大,这两个相邻区域的界线就可能呈现在图像上。该界线原本是不存在于原图像中,因此称它为虚轮廓或虚边缘。76虚轮廓虚轮廓为了不产生虚轮廓,必须将相邻量化级所对应的亮度差异降低到肉眼分辨不出来的程度。这个程度,可以通过韦伯实 验 估 计 。韦 伯比值 Cw约为 0 . 0 2 的 定 值 , 在 1 -1000cd/m2范围有效。举一个胶片数字化例子。假设胶片的最大和最小透射率分别为t1和t2,那么与光学密度有光的动态量程D可以表示为:21(lglg )Dtt 因此,必要的量化级数Q为

    26、 lg(1)wDQC当t1=0.9,t2=0.009,Cw=0.02时,则D=2.0,Q=233。 这种量化是线性量化这种量化是线性量化吗?吗?1.3.4 扫描扫描采样、量化只是一个概念性流程,实际进行的采样、量化顺序和方法,根据图像输入仪器结构和方式的不同也有所不同。顺序移动读取图像上的点一般称作扫描。扫描是扫描是将二维或三维表达的拍摄对象的灰度变换为一维将二维或三维表达的拍摄对象的灰度变换为一维时间信号的过程时间信号的过程。由于声音原本是一维时间信号,所以在数字化中不存在扫描的概念,即扫描是图像数字化所特有的。扫描不仅用在图像数字化上,电视摄像机等的模拟图像摄像系统向一维时间信号的变换需要

    27、扫描。相反,由一维时间信号再生图像,显示在平面CRT显示器和液晶显示器上也要进行扫描。78扫描扫描光栅扫描n逐行扫描n隔行扫描(EIA) RS-170美国单色广播电视标准n30 frames/sn525 lines/framen2 fields/framen50 us/linen225 cycles/linen225/50=4.5 MHz Bandwidthn24.5=9 MHz Sampling frequency(EIA) RS-170A(NTSC)与 RS-170略有差异的彩色电视标准CCIR,PAL 欧洲与中国等的单色及彩色模拟电视标准25frames/s, 625lines/fram

    28、eframe:帧 field:场PAL= Phase Alternating Line(逐行倒相制式)NTSC=National Television System Committee(全国电视系统委员会美)EIA: Electronic Industries Association数字图像L(i,j)中像素为二维排列,其坐标系和像素标号使用了多种形式:处理光栅型数字图像时,经常使用以左上角为原点的坐标系(a),(b),处理向量型数字图像时,经常使用以左下角为原点的坐标系(c),(d) 。)1,1()1 ,1()0 ,1()1,1()1 ,1()0 ,1()1,0()1 ,0()0 ,0(),

    29、(NMLMLMLNLLLNLLLjiL),()2 ,()1 ,(),2()2 ,2()1 ,2(),1()2 ,1()1 ,1(),(NMLMLMLNLLLNLLLcrLIn matlab:Row12.MCol 1 2 . . . N在这个坐标系统中,图像被看作在这个坐标系统中,图像被看作离散单元,在像素坐标与离散单元,在像素坐标与Matlab中表示矩阵的下标之间有一一对中表示矩阵的下标之间有一一对应关系应关系. 这种对应关系使得图像这种对应关系使得图像数据矩阵与图像显示方式之间的数据矩阵与图像显示方式之间的关系非常易于理解。关系非常易于理解。2001801008020018010040200

    30、1005030180703010对于一个对于一个 3232图像图像,8bit灰灰度图像度图像有多少灰度级?总数据量是多少?对于这类图像共可表示多少幅不同的图像?如果这是一个如果这是一个RGB彩色图像彩色图像, 8bit3,那么,那么共有多少种色彩?图像数据量又是多少?84 由于彩色图像具有相当于三原色的三个通道,所以称为三通道图像。单色图像称为单通道图像。 各通道以k表示时,多通道图像可以表示为Lk(i,j)。假设k=1,2,K时,各像素的灰度水平可以记为向量L=L1,L2,LKLK表示通道k的灰度水平。这时向量L是指向K维空间的某一点。在这个意义上,多通道图像也可称为多维图像。86多通道图像

    31、在计算机中的表达(存储)方式,按通道排列顺序不同,有CIP(Channel Interleaved by Pixel),CIL(Channel Interleaved by Line),CSQ(Channel Sequential)三种格式。如图1-14所示,当M(行)x N(列)x K(通道)的图像采用图1-13(a)坐标系时,其在这三种格式中的像素排列方式。如果能够将全部图像数据放在内存或缓存中进行处理时,上述三种排列方式没有区别。但是,由于内存有限,依次在内存中读取必要的部分图像数据进行处理时,根据数据存储格式的不同其访问速度大不相同,即按像素单位对各通道的灰度水平进行操作时,采用CIP

    32、格式较好;但在按各通道单位访问时,采用CSQ格式较好;CIL格式则居于两者之间。8788 四个水平和垂直像素 4-邻域+4 对角像素0 1 01 p 10 1 01 1 11 p 11 1 1898-邻接的模糊性!m: mixed混合的902122)()(),(tysxqpDe),max(),(8tysxqpDtysxqpD),(4D(p,q)=0 (D(p,q)=0 if p=q)D(p,q)=D(q,p), andD(p,q)=D(p,z)+D(q,z)D4 距离:D8 距离:欧氏距离:22 1 22 1 0 1 22 1 222 2 2 2 22 1 1 1 22 1 0 1 22 1

    33、1 1 22 2 2 2 2212 1 0 1 2122222对于像素p, q, z, 以及其坐标 (x,y), (s,t), 和 (u,v), D 就是一个距离函数或测度,如果灰度分布特性对比度噪声分辨率锐化度(自学补充讲义)调制传递函数(自学补充讲义)图像的明暗变化情况称作灰度等级或色调,灰度等级的具体表现一般称作灰度分布特性。灰度分布特性的好坏,取决于中间色调的数量以及如何使用这些中间色调。如果中间色调数量少,图像质量将会明显降低。灰度直方图反映了图像灰度级的最小值、最大值、平均值以及标准差等各灰度分布参数,因此可以用作评价灰度分布特性的指标。图像的明暗差别称作对比度。如何定义图像的明暗

    34、程度依赖于图像媒介。在自身不发光的情况下(称为反射型图像),使用数字图像中的灰度最大值Lmax和最小值Lmin来定义对比度CmaxminmaxminLLCLL%Contrast = (255-105)/(255+105) = 41.6%255105是原本并不存在于输入或输出之前的图像灰度中,也不存在于拍摄对象的亮度等原始信号中的信号。噪声一般分为随机噪声和系统噪声。作为与噪声相关的图像质量指标,经常使用信噪比(SNR)。信噪比指的是信号S和噪声N之间的比,以S/N的形式表示。22/10lg10lg20lg(dB)pvvpvVSS NNSSSS NNNN用分贝(dB)单位表示时,S和N使用振幅的

    35、平方所表示的量(能量)。(下标p表示功率,下标v表示幅度)从数字图像灰度的角度出发,关注信噪比时,不用分贝单位而用无单位S/N计算得出信噪比将会更容易理解。但是,涉及感性的图像质量评价时,建议使用分贝单位的S/N。这时因为人感觉到的亮度以及声音的大小或音质等感觉量与所给予的刺激量的对数大体上成正比。/10lg(dB)SS NNSS NN信号S和噪声N的定义,根据信号的认知方式和噪声的性质等,有不同的方法。关于信号S,如果将信号的波形振幅记为AS,那么可以使用AS的平方平均 ,平均的平方 ,RMS值 ,峰值PS以及峰-峰值PPS。作为噪声N,如将噪声波形振幅记为AN,随机噪声时要使用AN的平方平

    36、均 和RMS值 ;而脉冲噪声时使用峰值PN和峰-峰值PPN。最常用的是功率信噪比(平方平均,常写为SNR)和峰值信噪比(PSNR)。982SA2)(SA212)(SA2NA21 2()NANMSE(归一化均方误差归一化均方误差)11200E11200(,)(,)(,)MNxyMNxyfxyfxyfxyPMSE(峰值均方误差峰值均方误差)11200A2(,)(,)MNxyfxyfxyM N A M,N:图像尺寸图像尺寸,A: 峰值峰值)lg(10ESNR)lg(10APSNR( , ) ; ( , ) ;f x yf x y若输入图像系统输出图像),(- ),(),( yxfyxfyxe系统引入

    37、的误差为:系统引入的误差为: 分辨率是由空间分辨率(Spatial Resolution)和灰度(密度)分辨率(Density Resolution)共同决定的。空间分辨率,是通过线宽和线间隔相等的周期性黑白条纹图像上可辨别极限的线密度来定义。灰度分辨率是指在灰度级别中可分辨的最小变化(灰度梯度的一个量度)。常常把大小为MN、灰度级数为Q(Q=2k)的数字图像称为空间分辨率为MN像素、灰度分辨率为Q级(或k比特)灰度的数字图像。观察图中与Crowd 图像相对应的等偏好曲线,近于垂直,表明这类图像的感觉质量与所用灰度级数是近似独立的。当图像细节增加时等偏好曲线变得更垂直。这个结果表明对于有大量细

    38、节的图像可能只需要少数的灰度级。Face 和 Cameraman 图像的主观质量在空间分辨率增加的情况下,于某段间隔内保持相同,但是灰度级数实际上在减少。Face Cameraman CrowdMATLAB 表示表示 matrix laboratory, 是一种高性能的专业计算语言。以一种易用环境集成计算、可视化和编程 ,只要问题和解可表示成相似的数学符号,典型应用包括:nMath and computationnAlgorithm developmentnData acquisitionnModeling, simulation, and prototypingnData analysis,

    39、 exploration, and visualizationnScientific and engineering graphicsnApplication development, including graphical user interface building在大学里在大学里, MATLAB用作标准的计算工具,数学、工程与科学等学科. 工业上, MATLAB是研究、开发和分析的计算工具The Image Processing Toolbox (IPT) :是一组MATLAB函数集 (称作 M函数或 M-文件,扩展了 MATLAB 环境中的解决数字图像处理问题的函数集. 其他工具包其

    40、他工具包 : Signal Processing, Neural Network, Fuzzy Logic, and Wavelet Toolboxes.f = imread()Format NameDescriptionRecognized ExtensionsTIFFTagged Image .tif, .tiffJPEGJoint Photographic Experts Group.jpg, .jpegGIFGraphics Interchange Formats.gifBMPWindows Bitmap.bmpPNGPortable Network Graphics.pngother

    41、sHDF, PCX, ICO, CUR, RAS, PBM, PGM, PPMImage Format:图像类型图像类型:The Matlab image toolbox 支持四种图像类型:Intensity imagesBinary imagesIndexed imagesRGB imagesRead an image a matrix:f = imread(lena.bmp) can include path:f = imread(d:myimageslena.jpg)Get image size size(f)ans= 512 512m n = size(f);基本句法基本句法:f =

    42、imshow(f, G)where f is an image array, and G is the number of intensity levels used to display it. If G is omitted, it defaults to 256 levels. f = imshow(f, low high)f = imshow(f, )display the intensity values of individual pixels interactively:pixval基本句法基本句法:imwrite(f, )imwrite(f, patientl0_runi,ti

    43、f)imwrite(f, patientl0_runi.tif)For JPEG fileimwrite(f,bubbles25.jpg,quality,25)MATLAB provides a full programming language that enables you to write a series of MATLAB statements into a then execute them with a single command. You write your program in an ordinary text file, giving the file a name

    44、of . The term you use for becomes the new command that MATLAB associates with the program.M-files can be scripts that simply execute a series of MATLAB functions statements, or they can be that also accept arguments and produce output. function x, y = myfun (a, b, c) %Function definition line% H1 Li

    45、ne - A one-line summary of the functions purpose.% Help Text - One or more lines of help text that explain how to use the% function, This text is displayed when the user types help .x = prod(a, b); %Start of Function CodeUse the Demos to access demonstrations of MATLAB and related products. The styl

    46、e of the demos varies, but for many of them, you cannRun the demo. nLearn more about the topic. nView the source code for the demo. nCopy source code from the demo to your own M-files.Image Processing Toolbox DemosnDeblurring nEnhancement nImage Registration nImage Transformation nMorphology, Analys

    47、is, and Segmentation nTransform 视觉心理如何获取图像如何数字化图像图像的灰度分布、对比度、信噪比1 1、某个图形工作环境使用、某个图形工作环境使用32323232像素的图像作为图标,每像素的图像作为图标,每个像素可有个像素可有1616种颜色,总共能有多少种不同的图标?种颜色,总共能有多少种不同的图标? 假假设每一百万种可能的图标中有一个有用,若设每一百万种可能的图标中有一个有用,若100dpi100dpi(dot dot per inchper inch)的密度一个挨一个地打印这些图标,需要用多)的密度一个挨一个地打印这些图标,需要用多大的一张纸?如果这个方案行

    48、不通,改成每张纸打印大的一张纸?如果这个方案行不通,改成每张纸打印8 8 1010个图符将要用多少张纸才能装下这些有用的图标?假设个图符将要用多少张纸才能装下这些有用的图标?假设每张纸厚为每张纸厚为0.010.01英寸,这些纸摞起来有多厚?英寸,这些纸摞起来有多厚?2 2、一台光导摄像管摄像机的靶直径为、一台光导摄像管摄像机的靶直径为25mm25mm,感应点直径为,感应点直径为3535微米。若像素间距与点直径相同,它数字化一幅正方形微米。若像素间距与点直径相同,它数字化一幅正方形图像时的最大行数和列数是多少?若要数字化的图像为图像时的最大行数和列数是多少?若要数字化的图像为480 480 64

    49、0640像素,靶上的最大像素间距是多少?像素,靶上的最大像素间距是多少? 3 3、一周期信号频率、一周期信号频率 f f0 0=3Hz=3Hz。要通过计算其频谱来。要通过计算其频谱来确定它的谐波频率有多高(它已通过一截止频率确定它的谐波频率有多高(它已通过一截止频率为为48Hz48Hz的低通滤波器)。如果用临界采样数字化的低通滤波器)。如果用临界采样数字化该信号,最小的采样点个数是多少,在多长时间该信号,最小的采样点个数是多少,在多长时间内?内?4 4、给定一幅、给定一幅5 5* *4 4二值图像如图二值图像如图(a)(a)所示所示, ,该图像经过该图像经过压缩后变成如图压缩后变成如图(b)(b)所示,请给出该压缩处理的所示,请给出该压缩处理的 SNR SNR 和和 PSNRPSNR。1 1 0 01 1 1 01 1 0 01 0 0 01 1 0 01 1 0 01 1 0 01 1 0 01 1 0 01 1 0 0(a)(b)

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第一章-数字图像处理基础课件.ppt
    链接地址:https://www.163wenku.com/p-2927419.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库