sift算法详解及应用.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《sift算法详解及应用.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sift 算法 详解 应用
- 资源描述:
-
1、sift算法详解及应用2022-10-421.SIFT简介2.SIFT算法实现细节3.SIFT算法的应用领域4.SIFT算法的扩展与改进2022-10-43l 传统的特征提取方法 成像匹配的核心问题是将同一目标在不同时间、不同分辨率、不同光照、不同位姿情况下所成的像相对应。传统的匹配算法往往是直接提取角点或边缘,对环境的适应能力较差,急需提出一种鲁棒性强、能够适应不同光照、不同位姿等情况下能够有效识别目标的方法。2022-10-4419991999年年British ColumbiaBritish Columbia大学大卫大学大卫.劳伊(劳伊(David G.LoweDavid G.Lowe)
2、教授总结了现有)教授总结了现有的基于不变量技术的特征检测方法,并正式提出了一种基于尺度空间的、对的基于不变量技术的特征检测方法,并正式提出了一种基于尺度空间的、对图像缩放、旋转甚至仿射变换保持不变性的图像局部特征描述算子图像缩放、旋转甚至仿射变换保持不变性的图像局部特征描述算子SIFTSIFT(尺度不变特征变换),这种算法在(尺度不变特征变换),这种算法在20042004年被加以完善。年被加以完善。l SIFT提出的目的和意义David G.LoweComputer Science Department2366 Main MallUniversity of British ColumbiaVa
3、ncouver,B.C.,V6T 1Z4,Canada E-mail:lowecs.ubc.ca2022-10-45l 将一幅图像映射(变换)为一个局部特征向量集;特征向量具有平移、缩放、旋转不变性,同时对光照变化、仿射及投影变换也有一定不变性。Original image courtesy of David Lowe2022-10-46l SIFT算法特点 SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。多量性,即使少数
4、的几个物体也可以产生大量SIFT特征向量。经过优化的SIFT算法可满足一定的速度需求。可扩展性,可以很方便的与其他形式的特征向量进行联合。2022-10-47 目标的自身状态、场景所处的环境和成像器材的成像特性等因素影响图像配准/目标识别跟踪的性能。而SIFT算法在一定程度上可解决:目标的旋转、缩放、平移(RST)图像仿射/投影变换(视点viewpoint)光照影响(illumination)目标遮挡(occlusion)杂物场景(clutter)噪声l SIFT算法可以解决的问题Back2022-10-48 l SIFT算法实现步骤简述SIFT算法的实质可以归为在不同尺度空间上查找特征点(关
5、键点)的问题。SIFT算法实现物体识别主要有三大工序,1、提取关键点;2、对关键点附加详细的信息(局部特征)也就是所谓的描述器;3、通过两方特征点(附带上特征向量的关键点)的两两比较找出相互匹配的若干对特征点,也就建立了景物间的对应关系。2022-10-491.关键点检测2.关键点描述 3.关键点匹配4.消除错配点l SIFT算法实现步骤2022-10-410所谓关键点,就是在不同所谓关键点,就是在不同尺度空间尺度空间的图像下检测出的具有方向的图像下检测出的具有方向信息的局部极值点。信息的局部极值点。根据归纳,我们可以看出特征点具有的三个特征:根据归纳,我们可以看出特征点具有的三个特征:尺度尺
6、度 方向方向 大小大小1.哪些点是SIFT中要查找的关键点(特征点)?这些点是一些十分突出的点不会因光照条件的改变而消失,比如角点、边缘点、暗区域的亮点以及亮区域的暗点,既然两幅图像中有相同的景物,那么使用某种方法分别提取各自的稳定点,这些点之间会有相互对应的匹配点。2022-10-411 我们要精确表示的物体都是通过一定的尺度来反映的。现实世界的我们要精确表示的物体都是通过一定的尺度来反映的。现实世界的物体也总是通过不同尺度的观察而得到不同的变化。物体也总是通过不同尺度的观察而得到不同的变化。尺度空间理论最早在尺度空间理论最早在19621962年提出,其主要思想是通过对原始图像进年提出,其主
7、要思想是通过对原始图像进行尺度变换,获得图像多尺度下的尺度空间表示序列,对这些序列进行行尺度变换,获得图像多尺度下的尺度空间表示序列,对这些序列进行尺度空间主轮廓的提取,并以该主轮廓作为一种特征向量,实现边缘、尺度空间主轮廓的提取,并以该主轮廓作为一种特征向量,实现边缘、角点检测和不同分辨率上的特征提取等。角点检测和不同分辨率上的特征提取等。尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟人在距离目尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。标由近到远时目标在视网膜上的形成过程。尺度越大图像越模糊。尺度越大图像越模糊。2.什么是尺度空间(sc
8、ale space)?2022-10-412 根据文献根据文献Scale-space theory:A basic tool for analysing Scale-space theory:A basic tool for analysing structures at different scalesstructures at different scales我们可知,高斯核是唯一可以产生我们可知,高斯核是唯一可以产生多尺度空间的核,一个图像的尺度空间,多尺度空间的核,一个图像的尺度空间,L L(x,y,),x,y,),定义为原始图像定义为原始图像I(x,y)I(x,y)与一个可变尺度的与
9、一个可变尺度的2 2维高斯函数维高斯函数G(x,y,)G(x,y,)卷积运算。卷积运算。,*,L x yG x yI x y22221()(),exp22iiiixxyyG x y高斯函数尺度是自然存在的,不是人为创造的!高斯卷积只是表现尺度空间的一种形式2022-10-4133.3.高斯模糊高斯模糊 高斯模糊是在高斯模糊是在Adobe PhotoshopAdobe Photoshop等图像处理软件中广泛使用的处理等图像处理软件中广泛使用的处理效果,通常用它来减小图像噪声以及降低细节层次。这种模糊技术生成效果,通常用它来减小图像噪声以及降低细节层次。这种模糊技术生成的图像的视觉效果是好像经过一
10、个半透明的屏幕观察图像。的图像的视觉效果是好像经过一个半透明的屏幕观察图像。2022-10-414 2221rrexp22G22r=xyr为模糊半径,在减小图像尺寸的场合经常使用高斯模糊。在进行欠采样的时,通常在采样之前对图像进行低通滤波处理。这样就可以保证在采样图像中不会出现虚假的高频信息。2022-10-415在实际应用中,在计算高斯函数的离散近似时,在大概在实际应用中,在计算高斯函数的离散近似时,在大概33距离之外距离之外的像素都可以看作不起作用,这些像素的计算也就可以忽略。的像素都可以看作不起作用,这些像素的计算也就可以忽略。通常,图像处理程序只需要计算通常,图像处理程序只需要计算(6
11、1)(61)高斯模板大小的选择0.000000670.000022920.000191170.000387710.000191170.000022920.000000670.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000191170.006559650.054721570.110981640.054721570.006559650.000191170.000387710.013303730.110981640.225083520.110981640.013303730.000387710.000
12、191170.006559650.054721570.110981640.054721570.006559650.000191170.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000000670.000022920.000191170.000387710.000191170.000022920.00000067高斯模板2022-10-416高斯模糊具有圆对称性。高斯模糊具有圆对称性。高斯模糊具有高斯模糊具有线性可分线性可分的性质,也可以在的性质,也可以在二维图像上对两个独立的一二维图像上对两个独立
13、的一维空间分别进行计算维空间分别进行计算。这样可以大大。这样可以大大减少了运算的次数减少了运算的次数。对一幅图像进行多次连续高斯模糊的效果与一次更大的高斯模糊可以对一幅图像进行多次连续高斯模糊的效果与一次更大的高斯模糊可以产生同样的效果,大的高斯模糊的半径是所用多个高斯模糊半径平方产生同样的效果,大的高斯模糊的半径是所用多个高斯模糊半径平方和的平方根。例如,使用半径分别为和的平方根。例如,使用半径分别为 6 6 和和 8 8 的两次高斯模糊变换得的两次高斯模糊变换得到的效果等同于一次半径为到的效果等同于一次半径为 10 10 的高斯模糊效果,的高斯模糊效果,根据这个关系,使用多个连续较小的高斯
14、模糊处理不会比单个高斯较根据这个关系,使用多个连续较小的高斯模糊处理不会比单个高斯较大处理时间要少。大处理时间要少。高斯模糊的性质2268102022-10-417高斯金子塔的构建过程可分为高斯金子塔的构建过程可分为两步:两步:(1 1)对图像做高斯平滑;)对图像做高斯平滑;(2 2)对图像做降采样。)对图像做降采样。为了让尺度体现其连续性,在简单为了让尺度体现其连续性,在简单下采样的基础上加上了高斯滤波。下采样的基础上加上了高斯滤波。一幅图像可以产生几组(一幅图像可以产生几组(octaveoctave)图像,一组图像包括几层图像,一组图像包括几层(intervalinterval)图像。)图
15、像。4.高斯金字塔2022-10-418高斯图像金字塔共o组、s层,则有:0()2sSs尺度空间坐标;ssub-level层坐标;0初始尺度;S每组层数(一般为35)。2022-10-419 高斯金字塔的初始尺度高斯金字塔的初始尺度当图像通过相机拍摄时,相机的镜当图像通过相机拍摄时,相机的镜头已经对图像进行了一次初始的模头已经对图像进行了一次初始的模糊,所以根据高斯模糊的性质:糊,所以根据高斯模糊的性质:2logmin,3OM NM、N分别为图像的行数和列数0initinitprepre0initinitprepreinit第0层尺度pre被相机镜头模糊后的尺度 高斯金字塔的组数2022-10
16、-420 高斯金字塔的组内尺度与组间尺度高斯金字塔的组内尺度与组间尺度0()2sSs组内尺度是指同一组(octave)内的尺度关系,组内相邻层尺度化简为:112Sss组间尺度是指不同组直接的尺度关系,相邻组的尺度可化为:1()2s SSoos222s SsSSoo 由此可见,相邻两组的同一层尺度为2倍的关系2022-10-421 最后可将组内和组间尺度归为:i金字塔组数n每一组的层数1212(,)inkkk12Sk 2022-10-422上一组图像的底层是由前一组图像的倒数第二层图像隔点采样生成的。这样可以保持尺度的连续性。?为啥?2022-10-423 通过研究Lowe教授的论文发现,所有特
17、征点的检测都是基于了尺度不变的特性,特征点的检测占据了论文的大部分的篇章,具有十分重要的意义!Lindeberg在文献Scale-space theory:A basic tool for analysing structures at different scales指出尺度规范化的LoG算子具有真正的尺度不变性。LoG算子即(Laplacion of Gaussian),可以由高斯函数梯度算子GOG构建22222GGGxy尺度规范化的GoG算子尺度规范化的LoG算子22G2022-10-42422,1G x y kG x ykG222(,)(,)(,)(1)Gauss x y kGauss
18、 x yLOG x yGkLOG算子与高斯核函数的关系通过推导可以看出,LOG算子与高斯核函数的差有直接关系,由此引入一种新的算子DOG(Difference of Gaussians),即高斯差分算子。22222GGGxy2022-10-425DoG(Difference of Gaussian)函数,*,L x yG x yI x y,*,D x yG x y kG x yI x yL x y kL x yDoG在计算上只需相邻尺度高斯平滑后图像相减,因此简化了计算!应该是同一组内的相邻层吧?2022-10-426DoG高斯差分金字塔对应DOG算子,我们要构建DOG金字塔我们可以通过高斯差
19、分图像看出图像上的像素值变化情况。(如果没有变化,也就没有特征。特征必须是变化尽可能多的点。)DOG图像描绘的是目标的轮廓。2022-10-4272022-10-428 在检测极值点前对原始图像的高斯平滑以致图像丢失高频信息,所以Lowe建议在建立尺度空间前首先对原始图像长宽扩展一倍,以保留原始图像信息,增加特征点数量。在Lowe的论文中,将第0层的初始尺度定为1.6,图片的初始尺度定为0.5,则图像金字塔第0层的实际尺度为1.6 1.60.5 0.51.52 当对图像长宽扩展一倍时,便构建了-1层,该层尺度为1.6 1.6(2 0.5)(2 0.5)1.25P.S.:图像插值时,选用的插值函
展开阅读全文