计算机视觉发展史课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《计算机视觉发展史课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视觉 发展史 课件
- 资源描述:
-
1、20232023年年1 1月月2626日星期四日星期四1 1参考教材:参考教材:贾云得贾云得 机器视觉机器视觉科学出版社,科学出版社,2000参考书目:参考书目:1、图像处理、分析与机器视觉图像处理、分析与机器视觉(第二版)(第二版)M.Sonka,V.Hlavac,R.Boyle著,艾海舟等译,著,艾海舟等译,人民邮电出版社,人民邮电出版社,20032、机器视觉教程机器视觉教程W.E.Snyder,H.Qi著著 林学訚等译,机械工业出版社,林学訚等译,机械工业出版社,20053、计算机视觉计算机视觉马颂德著,科学出版社,马颂德著,科学出版社,1999课程教材课程教材20232023年年1 1
2、月月2626日星期四日星期四2 21.引言引言 智能机器智能机器:能模拟人类的功能,能感知外部世界并有效地能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题解决人所能解决问题感知系统感知系统:人类感知外部世界主要是通过视觉、触觉、:人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约听觉和嗅觉等感觉器官,其中约80%80%的信息是由视觉获取的信息是由视觉获取的因此的因此,对于智能机器来说,赋予机器以人类视觉功能对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学对发展智能机器是及其重要的,也由此形成了一门新的学科科计算机视觉计算机视觉
3、(也称机器视觉或图像分析与理解等也称机器视觉或图像分析与理解等)计计算机视觉的发展不仅将大大推动智能系统的发展,也将拓算机视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域宽计算机与各种智能机器的研究范围和应用领域 计算机视觉计算机视觉:研究用计算机来模拟生物视觉功能的科学:研究用计算机来模拟生物视觉功能的科学和技术计算机视觉系统的首要目标是用图像创建或恢复和技术计算机视觉系统的首要目标是用图像创建或恢复现实世界模型,然后认知现实世界现实世界模型,然后认知现实世界20232023年年1 1月月2626日星期四日星期四3 3 2020世纪世纪5050年代年代
4、归入模式识别归入模式识别-主要集中在二维图像分析和识主要集中在二维图像分析和识别上,如,光学字符识别,工件表面、显微图片和航空图片的别上,如,光学字符识别,工件表面、显微图片和航空图片的分析和解释等分析和解释等6060年代年代MIT MIT 的的RobertsRoberts通过计算机程序从数字图像中提取出诸通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述状及物体的空间关系进行描述Roberts Roberts 的研究工作开创了以理的研究工作开创了以理解三维场景为目的的三维计算
5、机视觉的研究解三维场景为目的的三维计算机视觉的研究RobertsRoberts对积木世对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景复杂的三维场景7070年代年代,已经出现了一些视觉应用系统,已经出现了一些视觉应用系统7070年代中期,麻省理年代中期,麻省理工学院工学院(MIT)(MIT)人工智能人工智能(AI)(AI)实验室正式开设实验室正式开设“计算机视觉计算机视觉”(Machine Vision)(
6、Machine Vision)课程,由课程,由B BK KP PHornHorn教授讲授教授讲授2.计算机视觉发展20232023年年1 1月月2626日星期四日星期四4 4MIT AI 实验室吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位他于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论(computational vision),该理论在80年代成为计算机视觉研究领域中的一个十分重要的理论框架20232023年年1 1月月2626日星期四日星期四5 5
7、研究热潮是从 20世纪80年代开始的,到了80年代中期,计算机视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等Marr的计算理论20232023年年1 1月月2626日星期四日星期四6 6许多会议论文集都反应了该领域的最新进展,比如:Int.Conf.on Computer Vision and Pattern Recognition(CVPR);Int.Conf.on Computer Vision(ICCV);Int.Conf.on Pattern Recognition(ICPR);Int.Conf.on R
8、obotics and Automation(ICRA);Workshop on Computer Vision,SPIE还有许多学术期刊也包含了这一领域的最新研究成果,如:IEEE Trans.on Pattern Analysis and Machine Intelligence(PAMI);Computer Vision,Graphics,and Image Processing(CVGIP);IEEE Trans.on Image Processing;IEEE Trans.on Systems,Man,and Cybernetics(SMC);Machine Vision and A
9、pplications;Int.J on Computer Vision(IJCV);Image and Vision Computing;Pattern Recognition20232023年年1 1月月2626日星期四日星期四7 73.Marr的视觉计算理论Marr Marr 的视觉计算理论的视觉计算理论Marr1982Marr1982立足于计算机科学,系统地立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果,概括了心理生理学、神经生理学等方面取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论是视觉研究中迄今为止最为完善的视觉理论 Marr Marr 建
10、立的建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展人们普遍认为,计算并大大推动了计算机视觉研究的发展人们普遍认为,计算机视觉这门学科的形成与机视觉这门学科的形成与MarrMarr的视觉理论有着密切的关系的视觉理论有着密切的关系20232023年年1 1月月2626日星期四日星期四8 8 3.1 信息处理三个层次信息处理三个层次20232023年年1 1月月2626日星期四日星期四9 93.2 视觉表示框架视觉表示框架第一阶段第一阶段(也称为早期阶段也称为早期阶段)是将输入的原始图像进行处理,是将
11、输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图征,这些特征的集合称为基元图(primitive sketch)(primitive sketch);第二阶段第二阶段(中期阶段中期阶段)是指在以观测者为中心的坐标系中,是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图三维表示,因此
12、,称为二维半图(2(25 dimensional sketch)5 dimensional sketch);第三阶段第三阶段(后期阶段后期阶段)是在以物体为中心的坐标系中,由输是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。入图像、基元图、二维半图来恢复、表示和识别三维物体。20232023年年1 1月月2626日星期四日星期四1010表1-2 由图像恢复形状信息的表示框架名 称目 的基 元图像光强表示图像中每一点的强度值基元图表示二维图像中的重要信息,主要是图像中的强度变化位置及其几何分布和组织结构零交叉,斑点,端点和不连续点,边缘片断,有效线段,组合群,
13、曲线组织,边界 25维图在以观测者为中心的坐标系中,表示可见表面的方向、深度值和不连续的轮廓局部表面朝向(“针”基元)离观测者的距离深度上的不连续点表面朝向的不连续点3维模型表示在以物体为中心的坐标系中,用由体积基元和面积基元构成的模块化多层次表示,描述形状及其空间组织形式分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积基元或面积形状基元都附着在轴线上20232023年年1 1月月2626日星期四日星期四1111MarrMarr理论是计算机视觉研究领域的划时代成就,但该理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议比如理论不是十分完
14、善的,许多方面还有争议比如:视觉处理框架基本上是自下而上,没有反馈视觉处理框架基本上是自下而上,没有反馈;没有足够地重视知识的应用没有足够地重视知识的应用MarrMarr理论给了我们研究计算机视觉许多珍贵的哲学思理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了想和研究方法,同时也给计算机视觉研究领域创造了许多研究起点。许多研究起点。3.3 Marr 视觉理论的不足视觉理论的不足20232023年年1 1月月2626日星期四日星期四1212 计算机视觉应用系统 照明 成像装置 计算机视觉 场景 图象 描述 应用反馈20232023年年1 1月月2626日星
15、期四日星期四13134.计算机视觉的应用计算机视觉的应用 零件识别与定位零件识别与定位 (工业生产线)(工业生产线)产品检验产品检验 (纺织工业棉花质量检验)(纺织工业棉花质量检验)移动机器人导航(星球机器人)移动机器人导航(星球机器人)遥感图像分析(植被分析)遥感图像分析(植被分析)医学图像分析(骨骼定位)医学图像分析(骨骼定位)安全鉴别、监视与跟踪(门禁系统)安全鉴别、监视与跟踪(门禁系统)国防系统(目标自动识别国防系统(目标自动识别ATRATR与目标跟踪)与目标跟踪)其它(动画、体育、考古)其它(动画、体育、考古)20232023年年1 1月月2626日星期四日星期四1414Sojour
16、ner 火星车前部图,中部的两个小突出是两个黑白CCD摄像机20232023年年1 1月月2626日星期四日星期四151520232023年年1 1月月2626日星期四日星期四1616Rocky 7 火星机器人20232023年年1 1月月2626日星期四日星期四171720232023年年1 1月月2626日星期四日星期四1818 Rocky7视觉系统获取的立体图象对障碍物探测示意图Rocky7 视觉系统对场景的深度恢复 20232023年年1 1月月2626日星期四日星期四1919CMU月球探测实验车Nomad漫游者20232023年年1 1月月2626日星期四日星期四2020月球探测实验
展开阅读全文