模式识别第3章-人工神经网络及模式识别分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模式识别第3章-人工神经网络及模式识别分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 人工 神经网络 分析 课件
- 资源描述:
-
1、第3章 人工神经网络及模式识别人工神经网络及模式识别 2022-6-82引言引言 模式识别:模式识别:研究的是如何用计算机实现人脑的一些功能。人脑:人脑:可看作是由大量神经元组成的巨大的神经网络。人工神经网:1943年,McCulloch和Pitts提出了神经元神经元的数学模型1949年,Hebb提出神经元的学习准则学习准则,为神经网络的学习算法奠定了基础50年代末,Rosenblatt提出了感知器模型感知器模型,首次把神经网络的研究付诸工程实践。1982年,Hopfield提出了神经网络模型,设计出用电子线路实现这一网络的方案,开拓了神经网络用于联想记忆和优化计算的新途径,大大促进了神经网络
2、的研究。1986年,Rumelhart及LeeCun等提出了多层感知器的反向传播算法向传播算法,克服了阻碍感知器模型发展的重要障碍。现在神经网络的应用已渗透到多个领域,如智能控制、模式识别、信号处理、计算机视觉、优化计算、知识处理、生物医学工程等。2022-6-833.1 人工神经元人工神经元 3.1.1生物神经元生物神经元 胞体。胞体。是神经细胞的本体(可看成系统)是神经细胞的本体(可看成系统)树突。树突。长度较短,接受自其他神经元的信号(输入)长度较短,接受自其他神经元的信号(输入)轴突。轴突。它用以输出信号它用以输出信号突触。突触。它是一个神经元与另一个神经元相联系的部位,是一个神经它是
3、一个神经元与另一个神经元相联系的部位,是一个神经元轴突的端部将信号(兴奋)传递给下一个神经元的树突或胞体;元轴突的端部将信号(兴奋)传递给下一个神经元的树突或胞体; 对树突的突触多为兴奋性的,使下一个神经元兴奋;对树突的突触多为兴奋性的,使下一个神经元兴奋; 而对胞体的突触多为抑制性,其作用是阻止下一个神经元兴奋。而对胞体的突触多为抑制性,其作用是阻止下一个神经元兴奋。2022-6-84神经元的基本工作机制神经元的基本工作机制一个神经元有两种状态:兴奋和抑制。平时处于抑制抑制状态的神经元,其树突和胞体接收其他神经元经由突触传来的兴奋兴奋电位;多个输入在神经元中以代数和多个输入在神经元中以代数和
4、的方式叠加;如果输入兴奋总量超过某个阈值,神经元就会被激发进入兴奋状态,发出输出脉冲,并由轴突的突触传递给其他神经元。神经元被触发之后有一个不应期不应期,在此期间内不能被触发,然后阈值逐渐下降,恢复兴奋性。2022-6-853.1.2 人工神经元人工神经元 (1)输入输入xi :相当于其他神经元的输出相当于其他神经元的输出;(2) 权值权值 i :相当于突触的连接强度相当于突触的连接强度(3) f: 是一个非线性函数是一个非线性函数 ,如阈值函数或,如阈值函数或Sigmoid函数函数2022-6-86神经元的动作:神经元的动作:当f为阈值函数时,其输出为:也可写为:或:其中:2022-6-87
5、1,1y 0,1y选取不同的输出函数选取不同的输出函数f,y的取值范围也不同的取值范围也不同则则则则某些算法要求某些算法要求f可微,此时通常选用可微,此时通常选用Sigmoid函数:函数: 若若或:若或:若1,1y 则则则则或:或:Sigmoid函数的特性:函数的特性:1)非线性,单调性。2)无限次可微。3)当权值很大时可近似阈值函数。当权值很小时可近似线性函数。0,1y2022-6-88 如果神经元ui接收来自另一神经元uj的输出,则当这两个神经元同时兴奋时,从uj到ui的权值wij就得到加强。 具体到前述的神经元模型,可以将Hebb规则表现为如下的算法: 式中 是对第i个权值的修正量 是控
6、制学习速度的系数。太大会影响训练的稳定性,太太大会影响训练的稳定性,太小则使训练的收敛速度变慢,一般取小则使训练的收敛速度变慢,一般取0 0 11; 人工神经网络首先要以一定的学习准则进行学习,然后才能工作3.1.3 神经元的学习算法神经元的学习算法- Hebb学习规则学习规则iiyxi2022-6-893.2 前馈神经网络前馈神经网络 3.2.1 前馈神经网络前馈神经网络 (用于监督学习) 网络的神经元接受前一级输入,并输出到下一级,无反馈无反馈。 节点分为两类:输入节点输入节点与计算单元计算单元。 每个计算单元可有任意个输入有任意个输入,但只有一个输出只有一个输出,而输出可藕合到任意多个其
7、他节点的输入。 前馈网络通常分为不同的层层,第i层的输入只与第i-1层的输出相联。输入节点为第一层输入节点为第一层。输入和输出输入和输出节点由于可与外界相连,称为可见层可见层,而其他的中间层则称为隐层隐层 。2022-6-8103.2.2 感知器(感知器(Perceptron ) 也称双层神经网络、单计算层感知器(1)输入层, 也称为感知层也称为感知层 每个节点接收一个输入信号,n个输入信号构成输入列向量X (2)具有计算单元的输出层 有m个神经元节点,均有信息处理能力,m个节点向外部输出信息,构成输出列向量O。(3) 两层之间的连接权值 用权值列向量Wj表示,m个权向量构成单层感知器的权值矩
8、阵W。 感知器模型示意图感知器模型示意图 o1 oj om W1 Wj Wm x1 x2 xi xn2022-6-811感知器感知器用于模式识别用于模式识别 输入X:样本的特征向量。 输出O:每个节点输出为: 0()()()nTjjjijijiosg n n etsg nwxsg nWX输出向量输出向量O可以用来表示类别属性:可以用来表示类别属性:例如: 若X j时,应使对应于该类的输出节点的输出Oj=1, 而其他节点的输出则为Oi=0 (或-1),1, 2 , .,iij o1 oj om W1 Wj Wm x1 x2 xi xn2022-6-812例例: 单计算节点感知器单计算节点感知器
9、(1)设输入向量设输入向量 X=(x1 ,x2)T则输出为:ojx1-Tx2则由方程 w1j x1+w2j x2- Tj=0 确定了二维平面上的一条分界线。(2) 输入n维向量,X=(x1,x2,,xn)T wijx1+w2jx2+wnj Tj=0确定了n维空间上的一个分界平面可见:可见:一个最简单的单计算节点感知器具有分类功能。可实现线性分类器0Txwxw10Txwxw1oj2j21j1j2j21j1j x1 * * * * O * * O * * O O * O x2 * * O O O O感知器的学习规则规则 可以用已知类别的模式向量或特征向量作为训练集 若X j,应使对应于该类的输出节
10、点的输出Oj=1, 而其他节点的输出则为Oi=0 (或-1)设理想的输出为: Y=y1,y2,y3,.,ymT某次迭代(k)上的实际输出为: Y=y1,y2,y3,.,ymT 对权值利用Hebb规则作如下的修改: wij(k+1)= wij(k)+ wij(k) 其中: wij(k)=(yj-yj)xj, i=1,2,n; j=1,m 为学习率,用于控制调整速度,太大会影响训练的为学习率,用于控制调整速度,太大会影响训练的稳定性,太小则使训练的收敛速度变慢,一般稳定性,太小则使训练的收敛速度变慢,一般0 0 11;2022-6-813感知器学习规则的训练步骤:感知器学习规则的训练步骤: (1)
11、 对各权值w0j(0),w1j(0),wnj(0),j=1, 2,m (m为计算层的节点数)赋予较小的非零随机数; (2) 输入样本对Xp,Yp,其中Xp=(-1,x1p,x2p,xnp), Yp为期望的输出向量,上标p代表样本对的序号,样本集中的样本总数为P,p=1,2,P; (3)计算各节点的实际输出:yjp(k)=sgnWjT(k)Xp, j=1,2,.,m (4)调整各节点对应的权值: Wj(k+1)= Wj(k)+Yjp-Yjp(k)Xp, j=1, 2,m, (5)返回到步骤(2),输入下一对样本,周而复始直到对所有 样本,感知器的实际输出与期望输出相等: Yjp(k)=Yjp20
12、22-6-8142022-6-815 感知器的学习过程与求取线性判别函数的过程是等价的 感知器的一些特性: 两层感知器两层感知器只能用于解决线性可分线性可分问题。 学习过程收敛很快,且与初始值无关。2022-6-816例: 单计算节点感知器,3个输入。给定3对训练样本对如下:X1 = (-1,1,-2,0)T y1 = 1X2 = (-1,0,1.5,-0.5)T y2 = 1X3 = (-1,-1,1,0.5)T y3 =1 设初始权向量设初始权向量W(0)=(0.5,1,-1,0)T,=0.1=0.1。注意,输入向量中第一个分量注意,输入向量中第一个分量x0恒等于恒等于-1,权向量中第一,
13、权向量中第一个分量为阈值,试根据以上学习规则训练该感知器。个分量为阈值,试根据以上学习规则训练该感知器。2022-6-817解:解:第一步第一步 输入输入X1,得得 WT(0)X1=(0.5,1,-1,0)(-1,1,-2,0)T=2.5 , y1(0)=sgn(2.5)=1W(1)= W(0)+y1- y1(0) X1 =(0.5,1,-1,0)T+0.1(-1-1)(-1,1,-2,0)T =(0.7,0.8,-0.6,0)T第二步第二步 输入输入X2,得,得 WT(1)X2=(0.7,0.8,-0.6,0)(-1,0,1.5,-0.5)T=-1.6 y2(1)=sgn(-1.6)= -1
14、W(2)= W(1)+y2- y2(1) X2 =(0.7,0.8,-0.6,0)T+0.1-1-(-1)(-1,0,1.5,-0.5)T =(0.7,0.8,-0.6,0)T = W(1)第三步第三步 输入输入X3,得,得 WT(2)X3=(0.7,0.8,-0.6,0)(-1,-1,1,0.5)T=-2.1 y3(2)=sgn(-2.1)=-1W(3)= W(2)+d3- o3(2) X3 =(0.7,0.8,-0.6,0)T+0.11-(-1)(-1,-1,1,0.5)T =(0.5,0.6,-0.4,0.1)T 第四步第四步 返回到第一步返回到第一步, 继续训练直到继续训练直到 yp(
15、k)- yp=03.2.3 三层前馈网络及三层前馈网络及MLP 三层前馈网络三层前馈网络由输入层、中间层和输出层构成。 有两个计算层 也称三层感知器层感知器 能够求解非线性问题 三层或三层以上的 前馈网络通常又被叫做多层感知器(Multi-Layer Perceptron简称MLP)。由三部分组成:由三部分组成: 、一组感知单元组成输入层;、一组感知单元组成输入层; 、一层或多层计算节、一层或多层计算节点的隐藏层;点的隐藏层; 、一层计算节点的输出层。、一层计算节点的输出层。 MLP的表示:输入节点数-第1隐层节点数-第2隐层节点数-,-输出节点数。如图,可表示为:4-4-3网络2022-6-
展开阅读全文