书签 分享 收藏 举报 版权申诉 / 165
上传文档赚钱

类型神经网络控制课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:5175293
  • 上传时间:2023-02-16
  • 格式:PPTX
  • 页数:165
  • 大小:1.43MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《神经网络控制课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    神经网络 控制 课件
    资源描述:

    1、神经网络(神经网络(neural networks,NN)生物神经网络生物神经网络(natural neural network,NNN):由中枢神经系由中枢神经系统(脑和脊髓)及周围神经系统(感觉神经、运动神经等)所统(脑和脊髓)及周围神经系统(感觉神经、运动神经等)所构成的错综复杂的神经网络,其中最重要的是构成的错综复杂的神经网络,其中最重要的是脑神经系统脑神经系统。人工神经网络人工神经网络(artificial neural networks,ANN):模拟模拟人脑神经人脑神经系统系统的结构和功能,运用大量简单处理单元经广泛连接而组成的结构和功能,运用大量简单处理单元经广泛连接而组成的人

    2、工网络系统。的人工网络系统。神经网络方法:神经网络方法:隐式隐式的的知识表示方法知识表示方法w人工神经网络:由许多处理单元,又称神经元,按照一定人工神经网络:由许多处理单元,又称神经元,按照一定的拓扑结构相互连接而成的一种具有并行计算能力的网络的拓扑结构相互连接而成的一种具有并行计算能力的网络系统。系统。特点:特点:w神经网络系统以大规模模拟并行处理为主,而不以串行离神经网络系统以大规模模拟并行处理为主,而不以串行离散数学符号处理为基础;散数学符号处理为基础;w神经网络系统具有较强的鲁棒性和容错性,能够进行联想、神经网络系统具有较强的鲁棒性和容错性,能够进行联想、概括、类比和推广,任何局部的损

    3、伤不会影响整体结果;概括、类比和推广,任何局部的损伤不会影响整体结果;w神经网络系统具有较强的自学习能力,系统可以通过不断神经网络系统具有较强的自学习能力,系统可以通过不断的学习,不断地补充和完善自己的知识,这是传统的人工的学习,不断地补充和完善自己的知识,这是传统的人工智能专家系统所没有的能力。智能专家系统所没有的能力。人工神经网络的定义人工神经网络的定义神经网络的基本特征与功能神经网络的基本特征与功能结构特征:结构特征:并行式处理并行式处理分布式存储分布式存储容错性容错性能力特征:能力特征:自学习自学习自组织自组织自适应性自适应性 神经网络的基本特征与功能神经网络的基本特征与功能联联想想记

    4、记忆忆功功能能非线性映射功能非线性映射功能输输入入样样本本 神神经经网网络络 输输出出样样本本 自自动动提提取取 非非线线性性映映射射规规则则 神经网络的基本特征与功能神经网络的基本特征与功能分类与识别功能分类与识别功能 传统分类能力传统分类能力 ANN 分类能力分类能力 神经网络的基本特征与功能神经网络的基本特征与功能优化计算功能优化计算功能 神经网络的基本特征与功能神经网络的基本特征与功能知识处理功能知识处理功能 问问 题题 解解 答答 知知 识识 分分 布布 式式 表表 示示 由由 同同 一一 知知 识识 获获 取取、知知 识识 库库 神神 经经 网网 平平 行行 推推 理理 络络 实实

    5、 现现 输输 入入 数数 据据 变变 量量 变变 换换 求求 解解 的的 问问 题题 神神 经经 网网 络络 专专 家家 系系 统统 的的 构构 成成 神经网络的基本特征与功能神经网络的基本特征与功能发展历史发展历史q 探索时期探索时期(开始于(开始于20世纪世纪40年代)年代):1943年,麦克劳(年,麦克劳(W.S.McCullocn)和匹茨()和匹茨(W.A.Pitts)首次提出一个神经网络模型)首次提出一个神经网络模型MP模型。模型。1949年,赫布(年,赫布(D.O.Hebb)提出)提出改变神经元连接强改变神经元连接强度的度的 Hebb学习规则。学习规则。发展历史发展历史 1958年

    6、,罗森布拉特(年,罗森布拉特(F.Rosenblatt)提出感知器模)提出感知器模型(型(perceptron)。)。1959年,威德罗年,威德罗(B.Widrow)等提出自适应线性元件等提出自适应线性元件(adaline)网络,通过训练后可用于抵消通信中的回)网络,通过训练后可用于抵消通信中的回波和噪声。波和噪声。1960年,年,他和他和 M.Hoff 提出提出LMS(Least Mean Square 最小方差)算法的学习规则。最小方差)算法的学习规则。q 第一次热潮时期:第一次热潮时期:20世纪世纪50年代末年代末 20世纪世纪60年代年代初初 发展历史发展历史 1969年,明斯基(年,

    7、明斯基(M.Minsky)等在)等在Perceptron中对感知器功能得出悲观结论。中对感知器功能得出悲观结论。1972年,年,T.Kohonen 和和 J.Anderson 分别提出能完成分别提出能完成记忆的新型神经网络。记忆的新型神经网络。1976年,年,S.Grossberg 在自组织神经网络方面的研究在自组织神经网络方面的研究十分活跃。十分活跃。q 低潮时期:低潮时期:20世纪世纪60年代末年代末 20世纪世纪70年代年代第一次热潮时期:20世纪50年代末 20世纪60年代初由输出单元或隐层单元所确定传统人工智能的研究部分地显示了人脑的归纳、推理等智能。处理功能的简单叠加。基本运算可归

    8、结为四种:BP学习算法由正向传播和反向传播组成:Hopfield)陆续提出离散的和连续的全互连神经网络模型,并成功求解旅行商问题(TSP)。三层感知器可识别任一凸多边形或无界的凸区域。控制器直接与系统的逆有关,通过引入滤波器来提高系统的鲁棒性。这个强调的是输入输出信号之间的联系。1、没有外部教师或监督机制;从图可见,随着训练次数的增加,训练集的J(t)减少,测试集的J1(t)可能不减小或增大,说明泛化能力减弱。BP网络:多层前向网络(输入层、隐层、输出层)。神经网络自适应评判分类器2、神经网络采用并行分布式信息处理方式,具有很强的容错性。2、BP神经网络PID控制器Anderson 分别提出能

    9、完成记忆的新型神经网络。层与层的连接是单向的,信息的传播是双向的。权值调整可分以下两种情况:泛化能力(综合能力、概括能力):用较少的样本进行训练,使网络能在给定的区域内达到要求的精度。发展历史发展历史q 第二次第二次热潮时期:热潮时期:20世纪世纪80年代至今年代至今 1982年年1986年,霍普菲尔德(年,霍普菲尔德(J.J.Hopfield)陆续)陆续提出离散的和连续的全互连神经网络模型,并成功求提出离散的和连续的全互连神经网络模型,并成功求解旅行商问题(解旅行商问题(TSP)。)。1986年,鲁姆尔哈特(年,鲁姆尔哈特(Rumelhart)和麦克劳)和麦克劳(McCellan)等在)等在

    10、Parallel Distributed Processing中提出反向传播学习算法(中提出反向传播学习算法(BP算法)算法)。1987年年6月,首届国际神经网络学术会议在美国圣地月,首届国际神经网络学术会议在美国圣地亚哥召开,成立了国际神经网络学会(亚哥召开,成立了国际神经网络学会(INNS)。)。q 神经网络控制的研究领域神经网络控制的研究领域 基于神经网络的系统辨识基于神经网络的系统辨识 神经网络控制器神经网络控制器 神经网络与其他算法(模糊逻辑、专家系统、遗传算神经网络与其他算法(模糊逻辑、专家系统、遗传算法等)相结合法等)相结合 优化计算优化计算 人类大脑大约包含有人类大脑大约包含有

    11、1.4 1011个个神经元,神经元,每个神经元与大约每个神经元与大约10103 310105 5个其它神经个其它神经元相连接,构成一个极为庞大而复杂的元相连接,构成一个极为庞大而复杂的网络,即生物神经网络。网络,即生物神经网络。生物神经元及其信息处理 神经生理学和神经解剖学的研究神经生理学和神经解剖学的研究结果表明结果表明,神经元,神经元(Neuron)(Neuron)是脑组织是脑组织的基本单元,是人脑信息处理系统的的基本单元,是人脑信息处理系统的最小单元。最小单元。生物神经元及其信息处理 生物神经元在结构上由生物神经元在结构上由 细胞体细胞体(Cell body)树突树突(Dendrite)

    12、轴突轴突(Axon)突触突触(Synapse)四部分组成。用来完成神经元间信息的接收、四部分组成。用来完成神经元间信息的接收、传递和处理。传递和处理。生物神经元及其信息处理信息转换发生在突触上信息转换发生在突触上(输入输入)(输出输出)神经冲动神经冲动生物神经元及其信息处理生物神经元的信息处理机理生物神经元的信息处理机理信息的产生信息的产生 神经元间信息的产生、传递和处理是一神经元间信息的产生、传递和处理是一种电化学活动。种电化学活动。神经元状态:神经元状态:膜电位:膜电位:生物神经元的信息处理机理生物神经元的信息处理机理生物神经元的信息处理机理生物神经元的信息处理机理空间整合:空间整合:同一

    13、时刻产生的刺激所引起的膜电同一时刻产生的刺激所引起的膜电位变化,大致等于各单独刺激引起的膜电位变位变化,大致等于各单独刺激引起的膜电位变化的代数和。化的代数和。时间整合:时间整合:各各输入脉冲输入脉冲抵达神经元的时间先后抵达神经元的时间先后不一样。不一样。总的突触后膜电位为一段时间内的累总的突触后膜电位为一段时间内的累积。积。生物神经网络生物神经网络 由多个生物神经元以确定方式和拓扑结构由多个生物神经元以确定方式和拓扑结构 相互连接即形成生物神经网络。相互连接即形成生物神经网络。生物神经网络的功能不是单个神经元信息生物神经网络的功能不是单个神经元信息 处理功能的简单叠加。处理功能的简单叠加。神

    14、经元之间的突触连接方式和连接强度不神经元之间的突触连接方式和连接强度不 同并且具有可塑性,这使神经网络在宏观同并且具有可塑性,这使神经网络在宏观 呈现出千变万化的复杂的信息处理能力。呈现出千变万化的复杂的信息处理能力。人工神经元是生物神经元的数学抽象人工神经元是生物神经元的数学抽象学习算法:正向传播、反向传播。3、数据内部所具有的特性(苹果和梨子)。从图可见,随着训练次数的增加,训练集的J(t)减少,测试集的J1(t)可能不减小或增大,说明泛化能力减弱。对于上面的单输入单输出的系统:生物神经网络的功能不是单个神经元信息人工神经网络包含有许多个人工神经元,这些人工神经元连接在一起构成一种特殊的网

    15、络结构。直接逆模型控制法是直观的一种神经网络控制器的实现方法,其基本思想是假设被控系统可逆,通过离线建模过程得到逆模型网络,然后用这一逆网络模型去直接控制被控对象。f为任意的线性或非线性函数。sigmoid 神经元神经网络辨识模型的结构为此,一般应使其具有在线学习能力,即作为逆模型的神经网络连接权能够在线调整。无导师信号提供给网络,网络能根据其特有的结构和学习规则,进行联接权系的调整,此时,网络的学习评价标准隐含BP学习算法的程序框图处理功能的简单叠加。通常在神经网络辨识中可选择白噪声或伪随机信号作为系统的输入信号。由n输入/单输出的单层感知器实现。由于变化对于其内在的结构的作用,使得神经网络

    16、以一种新的方式对环境进行响应。控制系统作为改进的依据;神经网络辨识模型的结构人工神经元人工神经元神经元通过信息传递进行工作,它们产生或接收由输出神经元通过信息传递进行工作,它们产生或接收由输出所组成的信息。所组成的信息。McCulloch-Pitts 模型(模型(1943年)年)输入输入输出输出w2w1w3wnwn-1.x1x2x3xn-1xny)(;1zHyxwzniii 人工神经元人工神经元McCulloch-Pitts 神经元的非线性概念神经元的非线性概念:),(wxfy y 是神经元的输出,是神经元的输出,x 是输入矢量,是输入矢量,w 是突触的权重是突触的权重矢量。如:矢量。如:22

    17、2|11awxaxweyeyTsigmoid 神经元神经元Gaussian 神经元神经元人工神经网络人工神经网络输入输入输出输出人工神经网络包含有许多个人工神经元,这些人工神人工神经网络包含有许多个人工神经元,这些人工神经元连接在一起构成一种特殊的网络结构。神经网络经元连接在一起构成一种特殊的网络结构。神经网络的目标是将输入转化为有意义的输出。的目标是将输入转化为有意义的输出。MPMP模型模型 0)(xf 1 x(b)作用函数 MP神经元模型神经元模型 )(ixf i 其他形式的作用函数其他形式的作用函数 (a)=1=1(b)=2=22阶跃函数阶跃函数 神经网络的数理模型神经网络的数理模型基本

    18、运算可归结为四种:基本运算可归结为四种:1.积与和积与和2.权值学习权值学习3.阈值处理阈值处理4.非线性函数处理非线性函数处理神经网络的工作方式神经网络的工作方式两个阶段组成:两个阶段组成:1.学习期:神经元间的联接权值,可由学习规则进行学习期:神经元间的联接权值,可由学习规则进行调整,以使目标(准则)函数达最小。调整,以使目标(准则)函数达最小。2.工作期:联接权值不变,由网络的输入,得到相应工作期:联接权值不变,由网络的输入,得到相应的输出。的输出。知识表达知识表达w神经网络是一个储存经验知识并能够有效运用的神经网络是一个储存经验知识并能够有效运用的系统;系统;w神经网络的主要任务是对世

    19、界(或环境)中所内神经网络的主要任务是对世界(或环境)中所内含的某种模式进行学习;含的某种模式进行学习;w知识包含两种信息:一种是已知状态,代表我们知识包含两种信息:一种是已知状态,代表我们已经知道的事实,被称之为先验知识;另一种是已经知道的事实,被称之为先验知识;另一种是观测(或测量),即通过某种感知手段所探知的观测(或测量),即通过某种感知手段所探知的环境信息,这些观测知识通常是包含着噪声或干环境信息,这些观测知识通常是包含着噪声或干扰的。扰的。神经网络的设计过程神经网络的设计过程w首先,要根据先验知识来选择一个适当的神经首先,要根据先验知识来选择一个适当的神经网络结构,然后用部分实例通过

    20、某种算法来训网络结构,然后用部分实例通过某种算法来训练网络。这个过程被称为练网络。这个过程被称为学习过程学习过程。w其次,没有用过的实例被用来对已经训练好的其次,没有用过的实例被用来对已经训练好的网络的进行测试,试验其性能。这个过程称之网络的进行测试,试验其性能。这个过程称之为为测试(或泛化)过程测试(或泛化)过程。学习过程学习过程w前页提到的学习过程很重要,它说明学习要包前页提到的学习过程很重要,它说明学习要包含以下顺序事件:含以下顺序事件:1.神经网络被环境所激励;神经网络被环境所激励;2.环境激励的结果是使神经网络发生变化;环境激励的结果是使神经网络发生变化;3.由于变化对于其内在的结构

    21、的作用,使得神由于变化对于其内在的结构的作用,使得神经网络以一种新的方式对环境进行响应。经网络以一种新的方式对环境进行响应。神经网络的不同分类神经网络的不同分类1.按性能:连续型与离散型按性能:连续型与离散型 确定型与随机型确定型与随机型 静态与动态网络静态与动态网络2.按联接方式:前馈(前向)型与反馈型按联接方式:前馈(前向)型与反馈型3.3.按逼近特性:全局逼近型与局部逼近型按逼近特性:全局逼近型与局部逼近型4.按学习方式:有导师的学习(监督学习)按学习方式:有导师的学习(监督学习)无导师的学习(无监督学习)无导师的学习(无监督学习)再励学习(强化学习)再励学习(强化学习)它们都是模拟人适

    22、应环境的学习过程的一种机器学习模型,它们都是模拟人适应环境的学习过程的一种机器学习模型,因此,具有学习能力的系统,称:因此,具有学习能力的系统,称:学习系统(学习机)学习系统(学习机)5.按工作方式:同步与异步按工作方式:同步与异步前馈型(前馈型(前向型)前向型)反馈型反馈型 (Hopfield神经网络)神经网络)也就是说,实际上不可能找到一个与实际系统完全等价的模型,所以辨识实际是按照某种标准,使之能最好地拟合所关心的实际系统的动态或静态特性。Hoff 提出LMS(Least Mean Square 最小方差)算法的学习规则。神经网络控制的优越性主要表现为:用于两类模式分类时,相当于在高维样

    23、本空间中,用一个超平面将两类样本分开。式中,f()是与Kp,Ki,Kd,u(k-1),e(k)相关的非线性函数。产生了神经网络控制系统。神经网络的基本特征与功能2、神经网络采用并行分布式信息处理方式,具有很强的容错性。构成基于BP神经网络的PID控制系统结构如下图所示。(3)计算网络的目标函数J控制系统作为改进的依据;相互连接即形成生物神经网络。下图为神经网络直接逆控制的两种结构方案。小的学习率可以使得系统收敛于一个稳定的解;由n输入/单输出的单层感知器实现。控制理论发展过程:经典控制理论、状态空间、动态规划、最优控制、智能控制。神经网络系统辨识应用实例泛化能力(综合能力、概括能力):用较少的

    24、样本进行训练,使网络能在给定的区域内达到要求的精度。确定型与随机型再励学习(强化学习)n同步同步(并行)并行)方式:方式:任一时刻神经网络中所有神经任一时刻神经网络中所有神经元同时调整状态元同时调整状态。n异步异步(串行)串行)方式:方式:任一时刻只有一个神经元调整任一时刻只有一个神经元调整状态,而其它神经元的状态保持不变。状态,而其它神经元的状态保持不变。有导师的学习(监督学习)有导师的学习(监督学习)在学习过程中,网在学习过程中,网络根据实际输出与期望络根据实际输出与期望输出的比较,进行联接输出的比较,进行联接权系的调整,将期望输权系的调整,将期望输出称为出称为导师信号。导师信号。导师信号

    25、导师信号是评价学习的是评价学习的标准(见图)。标准(见图)。期望输出期望输出实际输出实际输出学习机学习机输入输入NN比较比较有导师的学习(监督学习)有导师的学习(监督学习)有导师学习的特点:有导师学习的特点:1、有外部教师;、有外部教师;2、有错误纠正机制。、有错误纠正机制。常用的方法有:常用的方法有:1、最小二乘法(、最小二乘法(LMS););2、反向传播算法(、反向传播算法(BP)。)。运行方式:运行方式:1、离线;、离线;2、在线。、在线。无导师的学习无导师的学习(无监督、或称自组织)(无监督、或称自组织)无导师信号无导师信号提供给网提供给网络,网络能根据其特有的络,网络能根据其特有的结

    26、构和学习规则,进行联结构和学习规则,进行联接权系的调整,此时,网接权系的调整,此时,网络的学习评价标准隐含络的学习评价标准隐含 于其内部(见图)。于其内部(见图)。实际输出实际输出学习机学习机输入输入NN自我自我 比比 较较无导师的学习无导师的学习(无监督、或称自组织)(无监督、或称自组织)无导师学习的特点:无导师学习的特点:1、没有外部教师或监督机制;、没有外部教师或监督机制;2、使用竞争学习方式;、使用竞争学习方式;3、数据内部所具有的特性(苹果和梨子)。、数据内部所具有的特性(苹果和梨子)。再励学习(强化学习)再励学习(强化学习)把学习看为试探评价把学习看为试探评价过程,学习机选择一动作

    27、过程,学习机选择一动作作用于环境,环境的状态作用于环境,环境的状态改变,并产生改变,并产生再励信号再励信号反反馈至学习机,学习机依据馈至学习机,学习机依据再励信号与环境当前的状再励信号与环境当前的状态,再选择下一动作作用态,再选择下一动作作用于环境,选择的原则是使于环境,选择的原则是使受到奖励的可能性增大受到奖励的可能性增大(见图)。(见图)。状态状态输入输入 NN1 NN2 学习机学习机输出输出-动作动作 环境环境re学习学习修改权重修改权重w对于神经网络来说,学习的过程就是修改其连对于神经网络来说,学习的过程就是修改其连接突触的权重接突触的权重w wkjkj的过程。的过程。w令令w wkj

    28、kj为为n n时刻的突触权重,则时刻的突触权重,则n n时刻权重的调整时刻权重的调整值值 w wkjkj是突触权重是突触权重w wkjkj(n)(n)与一个修正值之和:与一个修正值之和:w通常,通常,w wkjkj(0)(0)可以随机设置。可以随机设置。)()()1(nwnwnwkjkjkj 误差调整学习误差调整学习w神经元神经元k k在在n n时刻的输出误差为:时刻的输出误差为:w误差之和为:误差之和为:w瞬时值:瞬时值:)()()(nyndnekkk )(212neEJkk )(212nejkk w调整调整 学习率,学习率,0 0w这个学习过程就类似于一个闭环反馈过程。这个学习过程就类似于

    29、一个闭环反馈过程。w学习过程的稳定性取决于学习率学习过程的稳定性取决于学习率 的选择:的选择:小的学习率可以使得系统收敛于一个稳定的解;小的学习率可以使得系统收敛于一个稳定的解;大的学习率可以加速学习的过程。大的学习率可以加速学习的过程。误差调整学习误差调整学习)()()(nxnenwjkkj HebbianHebbian学习学习w这是所有学习规则中最有名的一个,是神经心这是所有学习规则中最有名的一个,是神经心理学家理学家Heb(1949)提出的:提出的:w这个强调的是输入输出信号之间的联系。这个强调的是输入输出信号之间的联系。w它对神经元的修改强调输入激励下大的输出信它对神经元的修改强调输入

    30、激励下大的输出信号。号。)()()(nxnynwjkkj 神经网络辨识模型的结构梯度下降法的不足,是BP算法收敛速度慢的原因,有改进的BP算法克服其不足,如:nout 是输出层单元数。这种前馈加反馈的监督控制方法,不仅可以确保控制系统的稳定性和鲁棒性,而且可有效地提高系统的精度和自适应能力。由输出单元或隐层单元所确定(3)可引伸到n3维空间上的线性可分集合,一定可找到一超平面,将输入模式分为两类。四部分组成。Anderson 分别提出能完成记忆的新型神经网络。第一次热潮时期:20世纪50年代末 20世纪60年代初McCulloch-Pitts 神经元的非线性概念:但该方法需要知道对象的 信息

    31、。神经网络系统辨识应用实例层与层的连接是单向的,信息的传播是双向的。控制系统作为改进的依据;、神经网络作为实际系统的辨识模型,实际上也是系统的一个物理实现,可以用于在线控制。【例】线性不可分集合。BP网络:多层前向网络(输入层、隐层、输出层)。神经网络的主要任务是对世界(或环境)中所内含的某种模式进行学习;神经网络是一个储存经验知识并能够有效运用的系统;再励学习(强化学习)判断故障位置、状况等。神经网络的基本特征与功能竞争学习竞争学习w对神经元对神经元k来说,输入样本来说,输入样本x的网络输出必须是的网络输出必须是最大,才能成为赢家。最大,才能成为赢家。w获胜神经元得到全部的输出值,也被称为获

    32、胜神经元得到全部的输出值,也被称为“winner-takes-all”规则。规则。ncompetitio the losts k neuron if 0 ncompetitio the wins k neuron if )()(kjjkjwxnw Boltzmann学习学习w应用随机学习算法(应用随机学习算法(Boltzmann分布),分布),Hinton and Sejnowski,1986提出提出“模拟退火算法模拟退火算法”。w神经元组成一个回归结构,以二进位方法进行运神经元组成一个回归结构,以二进位方法进行运作。作。w这个机制由一个能量函数来描述这个机制由一个能量函数来描述 这里,这里,

    33、si 是神经元是神经元i的状态。的状态。i j 表示该机制不允许神经元自反馈。表示该机制不允许神经元自反馈。21jiijjijisswE w该机制运作如下:该机制运作如下:在学习过程中的某步,随机选择一个神经元,比如神在学习过程中的某步,随机选择一个神经元,比如神经元经元 j;计算在温度计算在温度T的前提下,神经元的前提下,神经元 j 从状态从状态 sj 转到转到-sj 的的概率概率 这里,这里,Ei 是能量变换;是能量变换;T是伪温度,不是物理学意是伪温度,不是物理学意义上的温度。义上的温度。Boltzmann学习学习)/exp(11)(TEssWjjj 感知器感知器 单层感知器单层感知器

    34、njuuu1 yx nw 1w )(xf )(xf n单层感知器单层感知器感知器的功能感知器的功能 x1 *O *O *O O *O x2 *O O O Ow1jx1+w2jx2-Tj=0 学习算法步骤学习算法步骤 学习算法步骤学习算法步骤 根据某样本训练时,均方差随训练次数的收敛情况根据某样本训练时,均方差随训练次数的收敛情况例子例子:例子:与非门逻辑例子:与非门逻辑w与非门属于线性可分问题。与非门属于线性可分问题。w以下方程可以将超平面分为两个决定域:以下方程可以将超平面分为两个决定域:Classe 1Classe 20 xwxw2211 单层感知器特点单层感知器特点 用于两类模式分类时,

    35、相当于在高维样本空间中,用于两类模式分类时,相当于在高维样本空间中,用一个超平面将两类样本分开。用一个超平面将两类样本分开。已证明:若输入的两类模式是线性可分集合(指存已证明:若输入的两类模式是线性可分集合(指存在一个超平面能将其分开),则算法一定收敛。在一个超平面能将其分开),则算法一定收敛。局限性:若输入模式为线性不可分集合,网络的学局限性:若输入模式为线性不可分集合,网络的学习算法不收敛,不能进行正确分类。习算法不收敛,不能进行正确分类。【例例】线性可分集合线性可分集合(a)分类器结构 2w 1w 0w y 10u 21uu 1u 2u (b)平面上两类模式分界线 平面上两类模式分类 f

    36、是误差矢量()函数。BP学习算法由正向传播和反向传播组成:下图为神经网络直接逆控制的两种结构方案。这是所有学习规则中最有名的一个,是神经心理学家Heb(1949)提出的:对于上面的单输入单输出的系统:为此,一般应使其具有在线学习能力,即作为逆模型的神经网络连接权能够在线调整。以上三大因素确定以后,神经网络的辨识就是一个最优化的问题。式中,f()是与Kp,Ki,Kd,u(k-1),e(k)相关的非线性函数。与传统自适应控制相同,神经网络自适应控制也分为神经网络自校正控制和神经网络模型参考自适应控制两种。nin 是输入层单元数;1、模型的选择模型只能是在某种意义下对实际系统的一种近似描述,它的确定

    37、要兼顾精确性和复杂性。nin 是输入层单元数;具有较强的泛化能力。而这种单神经元自适应控制器的学习功能就是通过改变权系数大小来实现的.例 输入输出样本:(3)可引伸到n3维空间上的线性可分集合,一定可找到一超平面,将输入模式分为两类。神经网络模式识别方法具有较强的容错能力、自适应学习能力、并行信息处理能力。1958年,罗森布拉特(F.测其参数,以实现系统参数的预测、预报。对于上面的单输入单输出的系统:人类大脑大约包含有1.BP网络的主要优缺点(2)三维空间上的两类模式,见表。三维空间上的两类模式,见表。2u 1u 0w 10u y 1w 3w 2w 321uuu 三维空间上的两类模式分类三维空

    38、间上的两类模式分类 (3)可引伸到可引伸到n3维空间上的线性可分集合,一定可找到维空间上的线性可分集合,一定可找到一超平面,将输入模式分为两类。由一超平面,将输入模式分为两类。由n输入输入/单输出的单层感知单输出的单层感知器实现。器实现。【例例】线性不可分集合。线性不可分集合。二维平面上的两类模式二维平面上的两类模式异或(异或(XOR)问题,见表。)问题,见表。二维平面中不存在一条直线,将输入模式分为两类,此输入模二维平面中不存在一条直线,将输入模式分为两类,此输入模式称线性不可分集合,见图。式称线性不可分集合,见图。可见:单层感知器不能解决异或问题。可见:单层感知器不能解决异或问题。u u1

    39、2 y 0 0 0 0 1 1 1 0 1 1 1 0 异或问题异或问题 2u 1u 多层感知器多层感知器 W2 W1 y 2z 21uu 1z 三层感知器结构三层感知器结构 三层感知器解决异或(三层感知器解决异或(XOR)问题)问题 y 与u1、u2 1 2uy1u W2 W1 y 2z 21uu 1z 三层感知器结构三层感知器结构 模 式 空 间 分 两 类 1u 2u 三层感知器可识别任一凸多边形或无界的凸区域。三层感知器可识别任一凸多边形或无界的凸区域。更多层感知器网络,可识别更为复杂的图形。更多层感知器网络,可识别更为复杂的图形。o1 ok ol W1 Wk Wl y1 y2 yj

    40、ym y0=-1 V1 Vm x0=-1 x1 x2 xi xn-1 xn 多层前馈网络与多层前馈网络与BP学习算法学习算法 多层前馈网络的反向传播多层前馈网络的反向传播(BP)学习算法,简称)学习算法,简称BP算法,算法,是有导师的学习是有导师的学习,它是,它是梯度下降法梯度下降法在多层前馈网中的应用。在多层前馈网中的应用。w网络结构网络结构见图,见图,u、y是网络的输入、输出向量,神经元用节点表示,是网络的输入、输出向量,神经元用节点表示,网络由输入层、隐层和输出层节点组成,隐层可一层,也可多层网络由输入层、隐层和输出层节点组成,隐层可一层,也可多层(图中是单隐层),前层至后层节点通过权联

    41、接。由于用(图中是单隐层),前层至后层节点通过权联接。由于用BP学学习算法,所以常称习算法,所以常称BP神经网络。神经网络。u y BP学习算法学习算法w已知网络的输入已知网络的输入/输出样本,即输出样本,即导师信号。导师信号。wBP学习算法由正向传播和反向学习算法由正向传播和反向传播组成:传播组成:w正向传播是输入信号从输入层经正向传播是输入信号从输入层经隐层,传向输出层,若输出层得隐层,传向输出层,若输出层得到了期望的输出,则学习算法结到了期望的输出,则学习算法结束;否则,转至反向传播。束;否则,转至反向传播。w反向传播是将误差反向传播是将误差(样本输出与样本输出与网络输出之差)按原联接通

    42、路反网络输出之差)按原联接通路反向计算,由梯度下降法调整各层向计算,由梯度下降法调整各层节点的权值和阈值,使误差减小。节点的权值和阈值,使误差减小。正向传播正向传播反向传播反向传播 u y BP神经网络神经网络正向传播计算正向传播计算w正向计算输出(正向计算输出(SigmoidSigmoid函数)函数)niiixwnet0neteneto 11)(1x1w10 x0w2x2wnxnwS S型函数型函数这里,输出的函数形式为:这里,输出的函数形式为:容易求得,容易求得,yey 11)()(1)()(yyydyd 多层感知器的权值学习多层感知器的权值学习w给定一个网络,设定隐层单元数和连接的结构;

    43、给定一个网络,设定隐层单元数和连接的结构;w用梯度下降法最小化网络输出值与目标值的平用梯度下降法最小化网络输出值与目标值的平方误差。方误差。误差准则误差准则w将网络误差将网络误差E定义为所有网络单元输出误差的定义为所有网络单元输出误差的总和:总和:这里,这里,d 是训练样本,是训练样本,k 为输出单元。为输出单元。DdoutputskkdkdotwE2)(21)(反向传播计算反向传播计算w每个训练样本对都是每个训练样本对都是 形式,这里形式,这里x 是网络是网络输入矢量,输入矢量,t 是网络的期望输出矢量。是网络的期望输出矢量。w网络其它参数如下:网络其它参数如下:是学习率;是学习率;nin

    44、是输入层单元数;是输入层单元数;nhidden 是隐层单元数;是隐层单元数;nout 是输出层单元数。是输出层单元数。w网络结构如图:网络结构如图:tx,u y 反向传播的推导反向传播的推导w按照梯度下降法,对每个训练样本按照梯度下降法,对每个训练样本d,权值,权值 wji 由由 wji 进行修改进行修改w这里这里 Ed 是训练样本是训练样本 d的总误差的总误差woutputs 是网络输出单元集合是网络输出单元集合jidjiwEw outputskkkdotwE2)(21)(生物神经元及其信息处理离散时间动态系统的辨识问题:由PID的增量式,令:再励学习(强化学习)粮食干燥塔系统简化图时间整合

    45、:各输入脉冲抵达神经元的时间先后不一样。基于神经网络的系统辨识神经网络混合控制可使控制系统同时具有学习、推理和决策能力。(3)计算网络的目标函数J由输出单元或隐层单元所确定由于变化对于其内在的结构的作用,使得神经网络以一种新的方式对环境进行响应。利用BP学习算法求出逆模型神经网络用于系统辨识的实质Hoff 提出LMS(Least Mean Square 最小方差)算法的学习规则。1943年,麦克劳(W.式中,f()是与Kp,Ki,Kd,u(k-1),e(k)相关的非线性函数。空间整合:同一时刻产生的刺激所引起的膜电位变化,大致等于各单独刺激引起的膜电位变化的代数和。四部分组成。Hopfield

    46、)陆续提出离散的和连续的全互连神经网络模型,并成功求解旅行商问题(TSP)。工作期:联接权值不变,由网络的输入,得到相应的输出。反向传播的推导反向传播的推导xjiwjiUnit iUnit jjiijijxwnet u对于单个神经元来说:对于单个神经元来说:反向传播的推导反向传播的推导w通过求偏导可得:通过求偏导可得:w权值调整可分以下两种情况:权值调整可分以下两种情况:由输出单元或隐层单元所确定由输出单元或隐层单元所确定jijdjidjiijijjijjdjidxnetEwExwnetwnetnetEwE 因因为为.第一种:输出单元权值调整第一种:输出单元权值调整jjjdjdnetooEne

    47、tE )()()(221)(21)(2122jjjjjjjjjjoutputskkkjjdotootototootooE 第一种:输出单元权值调整第一种:输出单元权值调整jjjdjdnetooEnetE )1()(jjjjjjoonetnetneto )1()(jjjjjdoootnetE 第一种:输出单元权值调整第一种:输出单元权值调整这样,权值的调整量为:这样,权值的调整量为:jijjjjjijdjidijxoootxnetEwEw)1()(第二种:隐单元权值调整第二种:隐单元权值调整 ijjijjjijijijjjijijonetfoEonetooEoonetEwnetnetEwEw i

    48、n1iiijijijjoowwwneth 第二种:隐单元权值调整第二种:隐单元权值调整式中,式中,不能直接计算,要通过其它间接量计算,即不能直接计算,要通过其它间接量计算,即 joEjkn1kkn1kjkkn1kn1jjjkjkjjn1kkjwwnetEowonetEonetnetEoEoooho 第二种:隐单元权值调整第二种:隐单元权值调整显然,显然,对于隐含层单元来说,权值调整量为对于隐含层单元来说,权值调整量为 on1kjkkjjwnetf in1kjkkjjin1kjkkjijowo1oownetfwoo 学习算法步骤:学习算法步骤:正向传播正向传播 u y 正向传播正向传播 u y

    49、(3)计算网络的目标函数)计算网络的目标函数J设设Ep为在第为在第p组样本输入时,网络的目标函数组样本输入时,网络的目标函数网络的总目标函数:网络的总目标函数:作为对网络学习状况的评价。作为对网络学习状况的评价。(4)若)若 则算法结束;则算法结束;否则,转(否则,转(5)。)。k2kpk2kpkp2pppte21tyd21tyd21tE pptEtJ tJ u y 反向传播反向传播 (5)反向传播计算)反向传播计算由输出层按梯度下降法反向计算,逐层调整权值由输出层按梯度下降法反向计算,逐层调整权值若若i为输出节点,即为输出节点,即i=k若若i不是输出节点,即不是输出节点,即 twtw1twi

    50、jijij jijjjjijxoootw)1()(ki in1kjkkjjijowo1owo BP学习算法的程序框图学习算法的程序框图p 1.特点特点l BP网络:多层前向网络(输入层、隐层、输出层)。网络:多层前向网络(输入层、隐层、输出层)。l 连接权值:通过连接权值:通过Delta学习算法进行修正。学习算法进行修正。l 神经元传输函数:神经元传输函数:S形函数。形函数。l 学习算法:正向传播、反向传播。学习算法:正向传播、反向传播。l 层与层的连接是单向的,信息的传播是双向的。层与层的连接是单向的,信息的传播是双向的。p 2.BP网络的主要优缺点网络的主要优缺点 l 很好的逼近特性。很好

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:神经网络控制课件.pptx
    链接地址:https://www.163wenku.com/p-5175293.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库