图像处理与计算机视觉技术综述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《图像处理与计算机视觉技术综述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 处理 计算机 视觉 技术 综述 课件
- 资源描述:
-
1、图像处理与计算机视觉技术综述图像处理与计算机视觉技术综述主要参考书主要参考书张广军,机器视觉张广军,机器视觉岗萨雷斯,数字图像处理岗萨雷斯,数字图像处理章毓晋图像工程章毓晋图像工程计算机视觉计算机视觉一种现代方法一种现代方法林学訚等译,林学訚等译,机器视觉算法与应用机器视觉算法与应用杨少荣等译,杨少荣等译,课程介绍课程介绍 基础知识基础知识 数学:线性代数、概率与统计数学:线性代数、概率与统计 计算机科学:软件编程计算机科学:软件编程 电子学:信号处理电子学:信号处理视觉重要?视觉重要? 古语 百闻不如一见 一目了然 眼见为实,耳听为虚。 人类信息的主要传递手段 视觉,听觉,味觉,触觉等 视觉
2、占60以上 人机交互 字符、图形 计算机接收信息手段单一(键盘,鼠标)图像处理重要?图像处理重要? 两大应用需求 对图像信息的改进 机器自动理解:使计算机具有视觉主要学科主要学科图像处理、计算机视觉和模式识别图像处理、计算机视觉和模式识别计算机图形学1.1 图像处理与计算机视觉的发展及系统构成图像处理与计算机视觉的发展及系统构成 1.图像(Image)可以看作是对物体或场景的一种表现形式抽象定义:二维函数f (x, y)(x, y): 点的空间坐标(实数)f : 点(x, y)的幅度(亮度、强度或灰度)英文单词Image:一般指用镜头等科技手段得到的视觉形象Picture:强调手工描绘的人物或
3、景物画Drawings:人工绘制的工程图Lenna1.1.1 图像处理与计算机视觉的概念图像处理与计算机视觉的概念 图像实例光学图像光学图像LennaLennaIKONOSIKONOS卫星卫星光学图像光学图像423mile 423mile 高高16000miles/h16000miles/h1m1m分辨率分辨率 EP EP3,3,海南陵水海南陵水,01-4-4,01-4-4大脑断大脑断层图像层图像 遥感图像遥感图像2.数字图像数字化:对 x,y 和 f 进行离散化 -其中的每个点称为图像元素,即像素。 分类(根据 f 的性质) 灰度图像(特殊:二值图像) 彩色图像3.数字图像处理DIP(Dig
4、ital Image Processing)广义:与图像相关的处理(图像分析、理解和计算机视觉等)狭义(从输入和输出内容):对图像进行各种加工,以改善图像的视觉效果或突出目标,强调图像之间进行的变换,是一个从图像到图像的过程广义上分为三种类型:低、中、高级处理图像处理主要是低级处理及部分中级处理3.数字图像处理低级处理:输入输出都是图像中级处理:图像分割及目标的描述,输出是目标的特征数据高级处理:目标物体及相互关系的理解,输出是更抽象的数据4.图像处理与计算机视觉的区别与联系图像处理与计算机视觉的区别与联系 图像处理主要集中在二维图像分析、识别和理解,如光学字符识别、工件表面、显微图片和航空照
5、片的分析和解释等。 计算机视觉是采用图像处理、模式识别、人工智能技术相结合的手段,着重于一幅或多幅图像的计算机分析,图像可以由单个或多个传感器获取,也可以是单个传感器在不同时刻获取的图像序列。分析是对目标物体的识别,确定目标物体的位置和姿态,对三维景物进行符号描述和解释。 机器视觉:计算机视觉技术工程化,能够自动获取和分析特定的图像,以控制相应的行为。 计算机视觉为机器视觉提供图像和景物分析的理论及算法基础,机器视觉为计算机视觉的实现提供传感器模型、系统构造和实现手段。1.1.2 图像处理与计算机视觉的发展图像处理与计算机视觉的发展1. 20世纪20年代:报纸业图像的编码与重构技术Bartla
6、ne电缆图片传输系统:从伦敦到纽约传送一幅图片从1周减少到3小时色调质量和分辨率改善1921年,电报打印机,5个灰度级1922年,穿孔纸带,5个灰度级1929年,15级灰度2. 1964年:航天技术年:航天技术60年代初作为一门学科,主要目的是改善图像质量,年代初作为一门学科,主要目的是改善图像质量,采取的方法有图像增强和复原技术采取的方法有图像增强和复原技术美国美国JPL(喷气推进)实验室处理卫星发射回来的(喷气推进)实验室处理卫星发射回来的月球表面的照片月球表面的照片应用图像畸变的校正、应用图像畸变的校正、灰度变换、去除噪声灰度变换、去除噪声3. 20世纪世纪70年代:遥感卫星和医学年代:
7、遥感卫星和医学图像增强和图像识别图像增强和图像识别 利用遥感图片,进行地质资源探测,农作物估产,水文气利用遥感图片,进行地质资源探测,农作物估产,水文气象监测象监测 等等图像重构图像重构 X光断层图像重构技术,英国光断层图像重构技术,英国G.N.Hounsfield 第一台脑第一台脑断层摄像仪应用断层摄像仪应用4. 20世纪70年代末:人工智能兴起,开始计算机视觉研究,由2D获取3D空间信息5. 80年代末到今:多媒体技术高速计算机和大规模集成电路的发展:图像压缩和多媒体技术;文本图像的分析和理解,文字的识别取得重大的进展;图像通讯和传输等的广泛应用1.1.3 图像处理与计算机视觉的系统构成图
8、像处理与计算机视觉的系统构成 系统构成框图 采集 装置:两部分 (1) 传感器:能产生与所接受到的电磁能量成正比的模拟电信号(CCD,CMOS) (2) 高速图像采集系统:它能将上述(模拟)电信号转化为数字(离散)的形式 输入设备 具备上述两种装置 如:数码相机,数码摄像机,扫描仪图像输入输出设备处理装置:两部分专用图像处理系统:是计算机的辅助处理器,主要采用专用集成芯片(ASIC)、数字信号处理器(DSP)或者FPGA等设计的全硬件处理器。 计算机:是整个系统的核心,除了控制整个系统的各个模块的正常运行外,还承担最后结果运算和输出。数字图像处理的关键步骤图像采集图像采集图像复原图像复原形态学
9、处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:图像采集数字图像处理的关键步骤:图像采集图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:图像增强数字图像处理的关键步骤:图像增强图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:
10、图像复原数字图像处理的关键步骤:图像复原图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:形态学处理数字图像处理的关键步骤:形态学处理图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:分割图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处
11、理处理图像压缩图像压缩数字图像处理的关键步骤:表示&描述图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:对象识别图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割对象识别对象识别图像增强图像增强表示表示&描述描述问题域问题域彩色图像彩色图像处理处理图像压缩图像压缩数字图像处理的关键步骤:图像压缩表示表示&描述描述彩色图像彩色图像处理处理图像压缩图像压缩图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割图像增强图像增强对象识别对象识别问题域
12、问题域数字图像处理的关键步骤:彩色图像处理表示表示&描述描述彩色图像彩色图像处理处理图像压缩图像压缩图像采集图像采集图像复原图像复原形态学处形态学处理理分割分割图像增强图像增强对象识别对象识别问题域问题域 存储 数据量度单位 比特(bit),字节(byte = 8 bit) 千字节( K byte) 兆(106)字节(M byte) 吉(109)字节(G byte) 太(1012)字节(T byte) 图像信息量大 10241024,灰度图:1M字节(不压缩) 10241024,真彩图:3M字节(不压缩) 存储 图像存储器 (1) 处理过程中使用的快速存储器计算机内存,帧缓存 (2) 较快的在
13、线或联机存储器磁盘,磁光盘 (3) 不经常使用的数据库(档案库)存储器磁带,光盘,光盘塔 存储 格式(表示格式和文件格式) (1) 矢量格式 用线段或线段的组合体来表示图像(WMF) (2) 光栅格式 用许多像素点的集合来表示图像 BMP格式,GIF格式,TIFF格式,JPEG 格式 1.2图象理解理论框架图象理解理论框架 1.2.1马尔视觉计算理论1.2.2对马尔理论框架的改进1.2.3关于马尔重建理论的讨论1.2.4新理论框架的研究 1.2.1马尔视觉计算理论马尔1982年出版了视觉一书 Marr D. 1982. Vision A Computational Investigation
14、into the Human Representation and Processing of Visual Information. W.H. Freeman 一个理解视觉信息处理的框架 要先理解视觉目的再去理解其中细节 1.2.1马尔视觉计算理论1.视觉是一个复杂的信息加工过程视觉是一个复杂的信息加工过程视觉是一个远比人所想象更为复杂的信息加工视觉是一个远比人所想象更为复杂的信息加工任务和过程,而且其难度常不为人们所正视任务和过程,而且其难度常不为人们所正视为理解视觉这个复杂的过程,要解决两个问题为理解视觉这个复杂的过程,要解决两个问题 视觉信息的表达问题:某些信息是突出的和明确视觉信息的
15、表达问题:某些信息是突出的和明确的,另一些信息则是隐藏的和模糊的的,另一些信息则是隐藏的和模糊的 视觉信息的加工问题:对信息处理、分析、理解视觉信息的加工问题:对信息处理、分析、理解,将不同表达形式转换,逐步抽象,将不同表达形式转换,逐步抽象 1.2.1马尔视觉计算理论2.视觉信息加工的三个要素视觉信息加工的三个要素计算理论;算法实现;硬件实现计算理论;算法实现;硬件实现 计算理论计算理论可计算性问题:一个任务要用计算机完成,它应可计算性问题:一个任务要用计算机完成,它应该是可以被计算的该是可以被计算的一般对于某个特定的问题,如果存在一个程一般对于某个特定的问题,如果存在一个程序,对于给定的输
16、入,这个程序都能在有限步序,对于给定的输入,这个程序都能在有限步内给出输出,这个问题就是可计算的内给出输出,这个问题就是可计算的 1.2.1马尔视觉计算理论2.视觉信息加工的三个要素视觉信息加工的三个要素计算理论计算理论目前视觉的可计算性常指对计算机给定输入,能目前视觉的可计算性常指对计算机给定输入,能否得到人类视觉可获得的类似结果否得到人类视觉可获得的类似结果两方面的研究内容:计算的是什么以及为什两方面的研究内容:计算的是什么以及为什么要计算它们;提出一定的约束条件,它么要计算它们;提出一定的约束条件,它们可唯一地确定最终得到的运算结果们可唯一地确定最终得到的运算结果 1.2.1马尔视觉计算
17、理论2.视觉信息加工的三个要素视觉信息加工的三个要素算法实现算法实现需要给加工所操作的实体选择一种合适的表达需要给加工所操作的实体选择一种合适的表达选择加工的输入和输出表达选择加工的输入和输出表达确定完成表达转换的算法确定完成表达转换的算法一般情况下可以有许多可选的表达一般情况下可以有许多可选的表达算法的确定常取决于所选的表达算法的确定常取决于所选的表达给定一种表达,可有多种完成任务的算法给定一种表达,可有多种完成任务的算法 1.2.1马尔视觉计算理论2.视觉信息加工的三个要素视觉信息加工的三个要素硬件实现硬件实现有了表达和算法在物理上如何实现算法也是有了表达和算法在物理上如何实现算法也是必不
展开阅读全文