书签 分享 收藏 举报 版权申诉 / 43
上传文档赚钱

类型《人工智能应用概论》课件第6章计算机视觉技术.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:3652754
  • 上传时间:2022-10-01
  • 格式:PPTX
  • 页数:43
  • 大小:9.17MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《《人工智能应用概论》课件第6章计算机视觉技术.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    人工智能应用概论 人工智能 应用 概论 课件 计算机 视觉 技术
    资源描述:

    1、人工智能应用概论第六章 计算机视觉技术PARTPART1 1神经网络与神经网络与深度学习技术原理深度学习技术原理 重温五四,你最像哪位文艺青年。设计上,以白色为背景,红蓝色调交叉,表达出五四青年节的主题。体验上,使用图片识别的技术,识别与用户上传的照片相似的有为青年,是一个很有意思的创意活动。技术上通过人脸检测与分析技术和人脸检索技术,将用户上传的照片与特定形象进行脸部层面的检索对比,通过匹配分析找出数据库中外貌特征与用户最为相似的一张照片。该创意为后续人工智能娱乐产品设计提供了参考。【案例】【案例】66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类1.图像分类 根据各自在图像信息中所

    2、反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类1.图像分类目前较为流行的图像分类架构是卷积神经网络(CNN)。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类2.对象检测识别图像中的对象这一任务,通常会涉及到各个对象输出边界框和标签。对象检测目标是对很多对象进行分类和定位。在多对象检测中,你必须使用边界框检测所给定图像中的所有目标。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类2.对象检测神经网络

    3、研究人员建议使用区域(region)这一概念,这样我们就会找到可能包含对象的“斑点”图像区域。RCNN是将卷积神经网络CNN引入目标检测的开山之作,更快、更高效的检测系统在 You Only Look Once(YOLO),Single Shot MultiBox Detector(SSD)和基于区域的全卷积网络(R-FCN)算法中尤为明显。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类3.目标跟踪视觉目标跟踪是计算机视觉中的一个重要研究方向,有着广泛的应用,如:视频监控、人机交互、无人驾驶等。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类3.目标跟踪视觉目标(单目标)

    4、跟踪任务就是在给定某视频序列初始帧的目标大小与位置的情况下,预测后续帧中该目标的大小与位置。输入初始化目标框,在下一帧中产生众多候选框(Motion Model)提取这些候选框的特征(Feature Extractor),然后对这些候选框评分(Observation Model)最后在这些评分中找一个得分最高的候选框,作为预测的目标(Prediction A)66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类4.语义分割语义分割是计算机视觉中十分重要的领域,它是指像素级地识别图像,即标注出图像中每个像素所属的对象类别。66.1 计算机视觉技术原理6.1.1.计算机视觉技术分类4.语义分

    5、割简单来说,分割的目标一般是将一张RGB图像(高度x宽度x 三通道rgb)或是灰度图(高度x宽度x单通道1)作为输入,输出的是分割图。66.1 计算机视觉技术原理6.1.2.计算机视觉技术发展历程1.5亿4千万年前-寒武纪生命大爆发5亿4千万年前,生物很简单,漂浮着,等待食物漂过嘴边。因为有的生物进化出了眼睛,才促使大爆发的。所以,视觉的诞生促进了生命大爆发.66.1 计算机视觉技术原理6.1.2.计算机视觉技术发展历程1.照相暗盒为了复制我们看到的世界达芬奇,在植物学,物理,数学,建筑等诸多领域都有很多贡献。这些发明创造被后人编辑成册,称为大西洋古抄本。其中就描述了暗盒的装置,它就是照相机的

    6、前身。通过小孔成像原理将外部的景象投影在暗盒的另一侧,再透过一个镜面反射到上面的玻璃上就可以进行临摹。66.1 计算机视觉技术原理6.1.2.计算机视觉技术发展历程3.计算机视觉技术萌芽-现代机器视觉技术的产生七八十年代,随着现代电子计算机的出现,计算机视觉技术也初步萌芽。这一阶段的应用主要是一些光学字符识别、工件识别、显微/航空图片的识别等等。九十年代至二十一世纪初,计算机视觉技术取得了更大的发展,广泛应用于工业领域。66.1 计算机视觉技术原理6.1.2.计算机视觉技术发展历程4.人工智能的眼睛-计算机视觉技术 七八十年代,随着现代电子计算机的出现,计算机视觉技术也初步萌芽。这一阶段的应用

    7、主要是一些光学字符识别、工件识别、显微/航空图片的识别等等。九十年代,计算机视觉技术取得了更大的发展,广泛应用于工业领域。机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉66.1 计算机视觉技术原理6.1.2.计算机视觉技术发展历程4.人工智能的眼睛-计算机视觉技术 借助于机器学习与深度学习的力量,自动从海量数据中总结归纳物体的特征,然后进行识别和判断。计算机视觉技术得到了爆发增长和产业化,包括典型的相机人脸检测、安防人脸识别、车牌识别等等。机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉。图像识别(image identification)转向尚待开发的图

    8、像理解(image understanding)机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉66.1 计算机视觉技术原理6.1.3.计算机视觉技术应用场景1.无人驾驶 计算机视觉在无人驾驶中起到了非常关键的作用,比如道路的识别,路标的识别,红绿灯的识别,行人识别等等平常驾驶过程中需要注意的。另外还包括三维重建及自主导航,通过激光雷达或者视觉传感器可以重建三维模型,辅助汽车进行自主定位及导航,进行合理的路径规划和相关决策。机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉66.1 计算机视觉技术原理6.1.3.计算机视觉技术应用场景2.人脸识别人脸识别技术目

    9、前已经研究得相对比较成熟,并在很多地方得到了应用,且人脸识别准确率目前已经高于人眼的识别准确率,很多高铁站及门禁的地方都用到了人脸识别,很多都有刷脸系统,有些城市甚至在银行取钱都可以直接刷脸。fuzh机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉66.1 计算机视觉技术原理6.1.3.计算机视觉技术应用场景3.?医疗影像辅助诊断 人工智能技术在医疗影像的应用主要通过机器视觉技术对医疗影像进行快速读片和智能诊断。通过快速准确地标记特定异常结构来提高图像分析的效率,以供放射科医师参考。提高图像分析效率,聚焦在需要更多解读或判断的内容审阅上,从而有望缓解放射科医生供给缺口问题。f

    10、uzh机器视觉在ILSVRC的比赛成绩屡创佳绩,其错误率已经低于人类视觉66.1 计算机视觉技术原理6.1.3.计算机视觉技术应用场景4.?机器视觉及工业检测 智能制造的核心要素之一是传感器技术机器视觉(Machine Vision,MV)则是重中之重。近些年,3D视觉、智能视觉等创新技术为工业自动化打开了“新视界”。眼镜框缩坑视觉检测眼镜框缩坑视觉检测PARTPART2 2 预备知识预备知识6世界坐标系6.2.1 计算机视觉成像6.2 6.2 预备知识预备知识 物体成像6 图像:图像可以定义为一个二维函数f(x,y),其中x和y是空间坐标,而f在任意坐标(x,y)处的幅度称为图像在该点处的亮

    11、度(图像的明亮程度)或者灰度。数字图像:指图像f(x,y)在空间坐标和亮度的数字化,数字图像由有限的元素组成,每一个元素都有一个特定的位置和幅值,这些元素称为图片元素、图像元素或像素。数字图像处理:是指借用数字计算机处理数字图像,既包括输入输出都是图像的处理,也包括从图像中提取特征的过程。6.2.2 数字图像6.2 6.2 预备知识预备知识66.2.3 图像处理技术6.2 6.2 预备知识预备知识66.2.3 图像处理技术6.2 6.2 预备知识预备知识车牌检测(Plate Detection):对一个包含车牌的图像进行分析最终截取出只包含车牌的一个图块66.2 计算机视觉技术原理6.2.4.

    12、卷积神经网络卷积神经网络 卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类。66.2 计算机视觉技术原理6.2.4.卷积神经网络图像处理解决方案深度学习图像识别技术,不再有人工特征抽取部分,而是使用多层卷积层来得到更深层次的特征图,这也就是端到端的含义。66.2 计算机视觉技术原理6.2.4.卷积神经网络卷积神经网络的层级结构 数据输入层/Input layer 卷积计算层/CONV layer ReLU激励层/Re

    13、LU layer 池化层/Pooling layer 全连接层/FC layer66.2 计算机视觉技术原理6.2.4.卷积神经网络卷积计算层这一层就是卷积神经网络最重要的一个层次,也是“卷积神经网络”的名字来源。在这个卷积层,有两个关键操作:局部关联。每个神经元看做一个滤波器(filter)窗口(receptive field)滑动,filter对局部数据计算先介绍卷积层遇到的几个名词:深度/depth(解释见下图)步长/stride(窗口一次滑动的长度)填充值/zero-padding66.2 计算机视觉技术原理6.2.4.卷积神经网络卷积计算层 卷积层中每一个节点的输入只是上一层神经网络

    14、的一小块,这个小块常用的大小有33或者55。卷积层试图将神经网络中的每一小块进行更加深入地分析从而得到抽象程度更高的特征。66.2 计算机视觉技术原理6.2.4.卷积神经网络卷积计算层5*5的图片(一个格子一个像素),滑动窗口取2*2,步长取2,则还剩下1个像素没法滑完,那怎么办呢?填充值的作用在原先的矩阵加了一层填充值,变成6*6的矩阵,那么窗口就可以刚好把所有像素遍历完。66.2 计算机视觉技术原理6.2.4.卷积神经网络ReLU激励层 CNN采用的激励函数一般为ReLU(The Rectified Linear Unit/修正线性单元),它的特点是收敛快,求梯度简单。66.2 计算机视觉

    15、技术原理6.2.4.卷积神经网络池化层 池化层夹在连续的卷积层中间,用于压缩数据和参数的量,减小过拟合,但不会改变图像的深度。简而言之,池化层的最主要作用就是压缩图像,将一张分辨率较高的图片转化为分辨率较低的图片。66.2 计算机视觉技术原理6.2.4.卷积神经网络全连接层 在经过多轮卷积层和池化层的处理之后,在卷积神经网络的最后一般会是由1到2个全连接层来给出最后的分类结果。其中Softmax主要用于分类问题,通过Softmax函数,可以得到当前样本属于不同种类的概率分布情况。PARTPART3 3 小试牛刀小试牛刀66.3 小试牛刀6.3.1 卷积神经网络解释器(cnn-explainer

    16、)CNN解释器(cnn-explainer)在线交互可视化工具 是一个通过网页浏览器就可以训练的简单神经网络并实现了可视化训练过程的工具。这个解释器展示了一个 10 层的神经网络,包含卷积层、激活函数、池化层等多个概念。能显示它的输入是哪些、经过了怎样细微的变化,就能了解CNN究竟是怎么回事,为什么可以辨识物品。66.3 小试牛刀6.3.1 卷积神经网络解释器(cnn-explainer)66.3 小试牛刀6.3.2 卷积神经网络解释器应用分析默认10类图片输入层:输入的图片经过裁剪,大小为 64 x 64,Red、Green、Blue分别为彩色图像的三个通道66.3 小试牛刀6.3.2 卷积

    17、神经网络解释器应用分析卷积层 卷积层为 conv_1_1(62,62,10),其中62 x 62为图像大小,10表示有10个神经元。因为这里设置了10个不同的卷积核,分别对输入图像提取特征,结果就得到10个特征图(10个神经元)特征图特征提取66.3 小试牛刀6.3.2 卷积神经网络解释器应用分析激活函数层 relu_1_1(62,62,10),表示对卷积结果conv_1_1(62,62,10)输出的10张特征图进行激活 66.3 小试牛刀6.3.2 卷积神经网络解释器应用分析池化层 66.3 小试牛刀6.3.2 卷积神经网络解释器应用分析全连接输出层 【本章小结】【本章小结】越来越多的视觉领域问题引入CNN得以良好解决,其算法展现出具有竞争力的结果。然而CNN也存在一些不足,例如训练、计算时间长,针对不同目的、场景,需要单独训练等问题。CNN作为目前典型的深度学习算法之一,也可以在建模问题和工程问题上做进一步的加强。相信在新一代先进的硬件设施面世后,基于深度模型架构通用性和统一性的视觉识别框架将会是机器视觉领域一致要求,深度卷积神经网络在机器视觉领域的舞台上定会发挥出更大的作用。【讨论】【讨论】1.CNN解释器默认有10张图片,选择不同的图片进行CNN分类,观察输出类别的概率。2.增加自定义图片,上传图片之后,进行CNN分类。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:《人工智能应用概论》课件第6章计算机视觉技术.pptx
    链接地址:https://www.163wenku.com/p-3652754.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库