《计算机视觉课件》课件1210v1-4.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《计算机视觉课件》课件1210v1-4.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机视觉课件 计算机 视觉 课件 1210 v1
- 资源描述:
-
1、目录背景介绍Contents1章节概述2小节介绍3本章总结4背景介绍B A C K G R O U N D机 器 学 习 背 景 介 绍 及 神 经 网 络 结 构 与 功 能 简 介ONE机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,其主要使用归纳、综合而不是演绎。机器学习背景最近十多年来,神经网络的研究工作不断深
2、入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题。在计算机视觉领域,神经网络作为深度学习模型的基础,在本章节将进行详细介绍。神经网络的用途背 景 介 绍神经网络(Neural Network,即NN)此处指的是人工神经网络,属于机器学习方法中的一个分支,是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。神经网络背景及结构章节概述C H A P
3、T E R O V E R V I E W本 章 节 内 容 简 介 及 思 维 导 图TWO本章将首先介绍神经网络的基础感知器模型的原理及激活函数相关内容,之后从原理及公式推导方面介绍神经网络的结构与前向传播及反向传播算法,最后在普通神经网络的基础之上,详细介绍卷积神经网络及循环神经网络的原理、结构、应用及演变模型。第四章第四章 神经网络神经网络本章简介本章简介思维导图思维导图章 节 概 述小节介绍S E C T I O N I N T R O D U C T I O N各 小 节 内 容 详 细 讲 解THREE、深度学习始于神经网络,神经网络始于感知器。4.1 感知器感知器由Frank
4、Rosenblatt在1957年第一次提出。这种结构以一个向量作为输入,计算输入每一维度的值的线性组合,然后和一个阈值进行比对,高于阈值则输出1,否则输出-1。简单来说就是加权求和,然后再和b进行比大小。基本概念感知器本质上就是一个仿射变换接一个非线性变换激活函数tanh函数sigmoid函数ReLU函数 表示一个非线性变换。在机器学习领域,这种非线性变换通常被称为激活函数。、4.2 神经网络基础输入层的向量传递到隐藏层之后,变成了一个四维向量,而这个三维向量到达输出层之后,最终变成二维。每一层的输出都和下一层所有的感知器输入相连,也就是通常所说的全连接(Fully Connected)。W代
5、表权值的总数,Pi代表第i层的感知器数量:神经网络基础最原始的输入层(x1,x2,x3)和4个不同感知器相连,这 4个感知器有2个输出,最终输出y1和y2。在这样一个经典的网络结构中,输入层后面的一层叫隐藏层,因为通常在训练和使用的时候,其输出对使用者来说是不可见的,然后是输出层。W代表权值的总数,Pi代表第i层的感知器数量:神经网络基础分层结构:如果把输入也当成一层,则每一层有一定数量的输出作为下一层的输入。从这个角度来说,可以把神经网络看作是对一个向量进行分步变换,每一层的输入向量经过这一层感知器变换之后,相当于变成了一个新的向量,并且新向量的维度等于这一层感知器单元的数量,这样一层层变换
6、直到形成最后的输出。整个神经网络的作用就是一个向量x,经过了变换之后成了一个向量y而己。所以在这种经典的结构中,对于一个n层(包含输入层和输出层)的网络,权值的数目和神经元数目的关系如下当网络层数不多的时候,随着感知器单元数量的增加,权值数目是平方增加的趋势、4.3 前向传播与反向传播算法随着神经网络的崛起而名声大噪的方法假设上一层结点i,j,k,与本层的结点w有连接,结点w的计算方法就是通过上一层的i,j,k等结点以及对应的连接权值进行加权和运算,最终结果再加上一个偏置项(图中为了简单省略了),最后通过一个非线性函数(即激活函数),如ReLU,sigmoid等函数,得到的结果就是本层结点w的
7、输出。最终通过逐层运算的方式,得到输出层结果。前向传播算法对于前向传播来说,不管维度多高,其过程都可以用如下公式表示:前向传播算法其中,上标代表层数,*表示卷积,b表示偏置项bias,表示激活函数。反向传播算法原理及推导符号含义结点a到结点b的权重结点a的输出值结点a的输入值结点a的损失损失函数结点激活函数左边字母,右边数字,代表第几层的矩阵或者向量abWayazaC1()1xf xe2W正向传播后:反向传播:最终结果:更新权值:链式推导:、4.4 卷积神经网络概述计算机视觉核心网络。卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。
8、卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层。这一结构使得卷积神经网络能够利用输入数据的二维结构,其中最早比较有名的卷积神经网络为LeNet-5。与其他深度学习结构相比,卷积神经网络在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。卷积神经网络概述普通神经网络卷积神经网络卷积神经网络利用输入是图片的特点,把神经元设计成三个维度:width,height,depth(注意这个depth不是神经网络的深度,而是用来
9、描述神经元的)。比如输入的图片大小是 32323(rgb),那么输入神经元就也具有32323的维度。一个卷积神经网络由很多层组成,它们的输入是三维的,输出也是三维的,有的层有参数,有的层则不需要参数。卷积神经网络概述、4.5&4.6 卷积神经网络结构与组成卷积神经网络通常包含以下几种层:(1)卷积层:卷积神经网路中每层卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。(2)线性整流层:这一层神经的活性化函数使用线性整流f(x
展开阅读全文