遗传算法与机器学习学习培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《遗传算法与机器学习学习培训课件.ppt》由用户(林田)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 遗传 算法 机器 学习 培训 课件
- 资源描述:
-
1、第六章第六章 遗传算法与机器学习遗传算法与机器学习概述概述分类器系统分类器系统CS-1(Holland)学习系统学习系统LS-1(Smith)组织学习方法(组织学习方法(Wilcox)6.1 概概 述述“学习学习”是一个由是一个由“未知未知”到到“知知”的过程。的过程。“学习学习”的目的是获得的目的是获得尽可能接近真实尽可能接近真实的的“知识知识”。“学习学习”过程包含了对已有知识的过程包含了对已有知识的“继承继承”和对未知知和对未知知识的识的“探索探索”。“学习学习”本身是一个本身是一个进化进化的过程。的过程。将将“进化计算进化计算”应用于应用于“学习学习”是是自然的自然的、合理的合理的。6
2、.1 概概 述述概念学习可以看作是对概念描述空间的一种启发式搜概念学习可以看作是对概念描述空间的一种启发式搜索。索。概念描述空间是对原始数据(即由教师或环境向学习概念描述空间是对原始数据(即由教师或环境向学习系统提供的某些概念的实例)使用一定推理规则得到系统提供的某些概念的实例)使用一定推理规则得到的。的。概念学习中所隐含的这种搜索机制以及它所采用的符概念学习中所隐含的这种搜索机制以及它所采用的符号表示方法,使得遗传算法在概念学习领域有其用武号表示方法,使得遗传算法在概念学习领域有其用武之地。之地。遗传算法本身固有的鲁棒性,使得基于遗传算法的概遗传算法本身固有的鲁棒性,使得基于遗传算法的概念学
3、习系统具有更少的限制性。念学习系统具有更少的限制性。6.1 概概 述述1978年年Holland等实现了第一个基于遗传算法的机器学等实现了第一个基于遗传算法的机器学习系统:一级认知系统习系统:一级认知系统CS-1(Cognitive System Level One)。)。1986年,年,Holland提出桶队算法(提出桶队算法(Bucket Brigade),),整个系统被称为分类器系统。整个系统被称为分类器系统。1980年,年,Smith提出提出LS-1系统。在某些重要方面,如染系统。在某些重要方面,如染色体的表示、反馈方式等,色体的表示、反馈方式等,LS-1和和CS-1有明显差异。有明显
4、差异。1993年,年,De Jong和和Spears提出提出GABIL系统,实现基于系统,实现基于GA的概念学习。的概念学习。6.1 概概 述述从应用角度来说,这些系统对从应用角度来说,这些系统对顺序决策顺序决策这类学习问题这类学习问题较为合适。该类问题可以描述如下:一决策主体以回较为合适。该类问题可以描述如下:一决策主体以回复方式与一具有离散时间状态的动态系统交互,在每复方式与一具有离散时间状态的动态系统交互,在每个时间步的开始,系统处于某确定状态。该主体依当个时间步的开始,系统处于某确定状态。该主体依当前状态,根据决策规则,从有限的动作集中选择一个前状态,根据决策规则,从有限的动作集中选择
5、一个动作供动态系统执行,并进入到一个新的状态。同时动作供动态系统执行,并进入到一个新的状态。同时向主体反馈一个补偿(向主体反馈一个补偿(payoff),其目的是发现一决),其目的是发现一决策规则集以使补偿最大化。策规则集以使补偿最大化。6.2 遗传机器学习系统的结构遗传机器学习系统的结构大多数学习系统都具有一个共同的特性:即它们都能够产大多数学习系统都具有一个共同的特性:即它们都能够产生结构上的变化来提高其内部知识结构的生结构上的变化来提高其内部知识结构的一致性一致性和和广泛性广泛性,发现和利用一些有意义的概念,增强其在环境下完成任务发现和利用一些有意义的概念,增强其在环境下完成任务的能力。的
6、能力。6.2 遗传机器学习系统的结构遗传机器学习系统的结构通常,可以将遗传学习系统分为两个子系统:一个基于通常,可以将遗传学习系统分为两个子系统:一个基于GA的用于产生合适的结构变化的的用于产生合适的结构变化的学习子系统学习子系统和一个用于完成和一个用于完成外部环境任务的外部环境任务的任务子系统任务子系统。系统通过系统通过任务探测器任务探测器从外部环境中获取环境信息,从外部环境中获取环境信息,任务子任务子系统系统则对这些信息进行处理,并产生一个对外部环境信息则对这些信息进行处理,并产生一个对外部环境信息的响应,这个响应通过的响应,这个响应通过任务效应器任务效应器作用到外部环境上。作用到外部环境
7、上。性性能探测器能探测器对任务子系统对外部环境所产生的影响进行检测,对任务子系统对外部环境所产生的影响进行检测,并将所检测到的信息传送到并将所检测到的信息传送到学习子系统学习子系统中,学习子系统利中,学习子系统利用这些信息对任务子系统的性能进行评估,并由此改变任用这些信息对任务子系统的性能进行评估,并由此改变任务子系统的内部结构,以提高系统的性能。务子系统的内部结构,以提高系统的性能。6.2 遗传机器学习系统的结构遗传机器学习系统的结构改变任务子系统结构的方式有三种:改变任务子系统结构的方式有三种:(1)用用GA改变一组预先定义的控制参数;改变一组预先定义的控制参数;(2)改变控制任务子系统行
8、为的更加复杂的数据结构,如改变控制任务子系统行为的更加复杂的数据结构,如“议程表议程表”;(2)直接修改任务子系统的控制程序,直接修改任务子系统的控制程序,6.3 匹兹堡方法与密西根方法匹兹堡方法与密西根方法 将产生式系统引入遗传机器学习领域后产生了两种重要的将产生式系统引入遗传机器学习领域后产生了两种重要的实现方法:实现方法:匹兹堡方法匹兹堡方法和和密西根方法密西根方法。匹兹堡方法:匹兹堡方法:将整个规则集合表示为一个个体,将整个规则集合表示为一个个体,GA维护一维护一个包含一定数目的候选规则集的种群。由匹兹堡个包含一定数目的候选规则集的种群。由匹兹堡(Pittsburgh)大学的)大学的D
9、e Jong和他的学生和他的学生Smith所提出。所提出。密西根方法:密西根方法:认为每个个体就是一条规则,而整个种群就认为每个个体就是一条规则,而整个种群就是规则集合。由密西根(是规则集合。由密西根(Michigan)大学的)大学的Holland和他的和他的学生学生Reitman提出。提出。一般认为,密西根方法更加适合于在线、实时的环境,在一般认为,密西根方法更加适合于在线、实时的环境,在这种环境下,系统行为上的激进的变化是不能容忍的。而这种环境下,系统行为上的激进的变化是不能容忍的。而匹兹堡方法更适合于离线的环境,在这种环境下,更加从匹兹堡方法更适合于离线的环境,在这种环境下,更加从容不迫
10、的搜索和更加激进的变化是可以接受的。容不迫的搜索和更加激进的变化是可以接受的。匹兹堡方法匹兹堡方法首先要选择适当的表示方法。首先要选择适当的表示方法。一种表示方法将单个规则作为一个基因,而将整个分类器一种表示方法将单个规则作为一个基因,而将整个分类器系统作为一个基因串(个体)。系统作为一个基因串(个体)。交叉算子提供规则的新的组合方式,而变异算子则提供新交叉算子提供规则的新的组合方式,而变异算子则提供新的规则。的规则。为了使得交叉算子和变异算子能够产生合法的个体,一种为了使得交叉算子和变异算子能够产生合法的个体,一种最简单的方法就是将所有的规则用固定长度、固定字段格最简单的方法就是将所有的规则
11、用固定长度、固定字段格式的二进制串来表示。这样,这些式的二进制串来表示。这样,这些“IFTHEN”规则就很规则就很自然地表示为一组固定数目的待匹配的传感器模式和一个自然地表示为一组固定数目的待匹配的传感器模式和一个在此模式下的动作。在此模式下的动作。匹兹堡方法匹兹堡方法也可以采用更加灵活的表示方法:用不定长的串来表示规也可以采用更加灵活的表示方法:用不定长的串来表示规则。这种情况下,需要对遗传算子进行修改才能保证得到则。这种情况下,需要对遗传算子进行修改才能保证得到合法的个体。一种方式就是在串中加入合法的个体。一种方式就是在串中加入“标点符号标点符号”,并,并通过这些通过这些“标点符号标点符号
12、”来区分各条规则和标注规则的内部来区分各条规则和标注规则的内部结构。结构。和表示方法相关的另外一个问题就是每个个体所包含的规和表示方法相关的另外一个问题就是每个个体所包含的规则数目。若将规则集合看做是一个程序或者是一个知识库,则数目。若将规则集合看做是一个程序或者是一个知识库,那么,规定每个个体包含相同数目的规则是极不自然的。那么,规定每个个体包含相同数目的规则是极不自然的。Smith成功地设计了一种成功地设计了一种GA,这种算法中的个体长度是变,这种算法中的个体长度是变化的。化的。密西根方法密西根方法Holland认为,对于一个特定的人(认知实体)的知识(经认为,对于一个特定的人(认知实体)
13、的知识(经验)的更自然的观点是将知识看做是一组规则,这组规则验)的更自然的观点是将知识看做是一组规则,这组规则在与环境的交互作用下不断改变。这一组知识并不是通过在与环境的交互作用下不断改变。这一组知识并不是通过每一代中进行的选择和交叉来进行演变,相反,这一组知每一代中进行的选择和交叉来进行演变,相反,这一组知识是在个体尽力使自己适应环境的过程中实时积累的。识是在个体尽力使自己适应环境的过程中实时积累的。“分类器系统分类器系统”认知模型认知模型在分类器系统中,在分类器系统中,GAs所操作的个体不是规则集合而是单所操作的个体不是规则集合而是单独的规则。独的规则。分类器系统中最重要也是最困难的问题是
14、信度分配问题,分类器系统中最重要也是最困难的问题是信度分配问题,也就是如何将适应度值分配到各条规则上去的问题。也就是如何将适应度值分配到各条规则上去的问题。桶队算法桶队算法6.4 分类器系统(分类器系统(CS-1)分类器系统是一种学习系统,它通过学习句法规则,分类器系统是一种学习系统,它通过学习句法规则,来指导系统在外部环境中的行为。来指导系统在外部环境中的行为。分类器系统由三部分构成:分类器系统由三部分构成:(1)规则和消息系统;规则和消息系统;(2)信度分配系统;信度分配系统;(3)遗传算法。遗传算法。分类器系统结构图分类器系统结构图6.4 分类器系统(分类器系统(CS-1)规则和消息系统
15、是一种特殊的产生式系统。规则的一规则和消息系统是一种特殊的产生式系统。规则的一般形式为:般形式为:IF THEN 其含义是:若满足条件其含义是:若满足条件C,则产生动作,则产生动作A。也就是说,。也就是说,若满足条件,则规则被若满足条件,则规则被“激发激发”。分类器所产生的动作,实际上也是一种消息,它可能分类器所产生的动作,实际上也是一种消息,它可能会使得效应器产生一个动作,也有可能激发另一个分会使得效应器产生一个动作,也有可能激发另一个分类器,还有可能不产生任何作用。类器,还有可能不产生任何作用。6.4 分类器系统(分类器系统(CS-1)分类器系统中采用长度一定的字符串表示一条规则分类器系统
16、中采用长度一定的字符串表示一条规则(分类分类器),这样,就可以保证句法上的合法性,同时,这种基器),这样,就可以保证句法上的合法性,同时,这种基于字符串的表示方法还使得应用遗传算子变得比较方便。于字符串的表示方法还使得应用遗传算子变得比较方便。:=0,1l:=0,1,#l :=:消息和条件进行匹配时的匹配原则是:消息和条件进行匹配时的匹配原则是:“1”与与“1”匹配,匹配,“0”与与“0”匹配,匹配,“#”是通配符,与是通配符,与“0”和和“1”都可以匹都可以匹配。配。6.4 分类器系统(分类器系统(CS-1)假设有一条消息为假设有一条消息为M(0 0 1 0 0),则以下条件都与它相匹,则以
17、下条件都与它相匹配:配:(0 0#0 0)、(0 0 1 0 0)、(#1 0 0)冲突解决机制:分类器系统中通过一种冲突解决机制:分类器系统中通过一种“拍卖拍卖”的方式,的方式,让所有的候选分类器通过竞争(花钱购买)来获得被让所有的候选分类器通过竞争(花钱购买)来获得被“激激活活”的权利。的权利。6.4 分类器系统(分类器系统(CS-1)信用分配机制信用分配机制桶队算法桶队算法对于分类器系统来说,衡量每个分类器的对于分类器系统来说,衡量每个分类器的“性能性能”非常困非常困难。但是,为了应用难。但是,为了应用GA对分类器进行改进,又必须要对每对分类器进行改进,又必须要对每个分类器在系统中的作用
18、做出一个评价。个分类器在系统中的作用做出一个评价。从外部环境信息到效应器响应动作之间就形成了一条响应从外部环境信息到效应器响应动作之间就形成了一条响应链,这条响应链建立了外部信息到效应器响应之间的映射链,这条响应链建立了外部信息到效应器响应之间的映射关系。关系。分类器之间以分类器之间以“交易交易”的形式传递消息,消息总是传递给的形式传递消息,消息总是传递给“报价报价”最高的那个分类器。最高的那个分类器。6.4 分类器系统分类器系统(CS-1)“报价报价”的计算的计算:“匹配精度匹配精度”的定义:匹配精度用于衡量消息与分类器的条件的的定义:匹配精度用于衡量消息与分类器的条件的“相似程度相似程度”
19、。匹配精度越高,两者之间的相似性越强。若分类。匹配精度越高,两者之间的相似性越强。若分类器器C C的激发条件与消息的激发条件与消息m m相匹配,则匹配精度可以定义为相匹配,则匹配精度可以定义为p p(C,mC,m)=1/1/R R(C C)其中,其中,R(C)R(C)代表代表C C的激发条件中通配符的激发条件中通配符“#”#”的数目。的数目。假定一个分类器假定一个分类器C在在t时刻的适应值为时刻的适应值为Strength(C,t),那么,当它,那么,当它成为候选分类器时,它给出的成为候选分类器时,它给出的“报价报价”为为Bid(C,t)=cbid*R(C)*Strength(C,t)其中,其中
20、,cbid为一常数,称为一常数,称报价系数报价系数。从上述定义中可以看出,候选。从上述定义中可以看出,候选分类器的报价与它的适应值成正比,与匹配精度成反比。分类器的报价与它的适应值成正比,与匹配精度成反比。6.4 分类器系统(分类器系统(CS-1)也可以将也可以将“报价报价”简单定义为简单定义为Bid(C,t)=cbid*Strength(C,t)若定义一个分类器在(若定义一个分类器在(t-1)时刻)时刻“出售出售”过一条稍息,则过一条稍息,则在在t时刻它将获得时刻它将获得收入收入I(t)。那么,一个候选分类器。那么,一个候选分类器“消费消费”一条消息后,它的适应值为一条消息后,它的适应值为S
21、trength(C,t+1)=Strength(C,t)-Bid(C,t)+I(t)6.4 分类器系统(分类器系统(CS-1)若一个分类器一直没有被激活,它就可以一直保持它的适应值不若一个分类器一直没有被激活,它就可以一直保持它的适应值不变。但是,若一条规则一直不被激发,那么这条规则也就没有存变。但是,若一条规则一直不被激发,那么这条规则也就没有存在的必要。所以,必须采用一定的方法来防止出现这种在的必要。所以,必须采用一定的方法来防止出现这种“不思进不思进取取”的现象。一种解决方法就是,在每一个时间步对所有的分类的现象。一种解决方法就是,在每一个时间步对所有的分类器征收器征收“人头税人头税”T
22、(C,t):T(C,t)=ctax*Strength(C,t)那么,分类器那么,分类器C在在t+1时刻的适应值可以表示为时刻的适应值可以表示为:Strength(C,t+1)=Strength(C,t)-Bid(C,t)-T(C,t)+I(t)上式可以化简为上式可以化简为Strength(C,t+1)=(1-K)*Strength(C,t)+I(t)其中,其中,K=cbid+ctax。6.4 分类器系统(分类器系统(CS-1)分类器重组机制分类器重组机制遗传算法遗传算法分类器系统用分类器系统用GA来生成新的,可能具有更好性能的分类器,并来生成新的,可能具有更好性能的分类器,并且淘汰一部分适应值
23、较低的分类器,以使分类器系统的整体性能且淘汰一部分适应值较低的分类器,以使分类器系统的整体性能不断提高。不断提高。一般来说,为保证学习系统性能的稳定性,不采用完全取代的方一般来说,为保证学习系统性能的稳定性,不采用完全取代的方法,而是选取一定比例的染色体来取代。法,而是选取一定比例的染色体来取代。需要确定一个时间步数需要确定一个时间步数Tga,这个参数表示两次调用,这个参数表示两次调用GA对分类器对分类器进行重组间的时间间隔。进行重组间的时间间隔。Tga可以任意确定。在实现时可以设置一可以任意确定。在实现时可以设置一些触发条件,当满足这些条件时,就调用些触发条件,当满足这些条件时,就调用GA对
24、规则进行重组。对规则进行重组。由于分类器中使用了三元字符表由于分类器中使用了三元字符表0,l,所以需要对经典变,所以需要对经典变异算子进行一定的修改。当发生变异时,从原来的字符变异到另异算子进行一定的修改。当发生变异时,从原来的字符变异到另外两个字符的概率相等。即外两个字符的概率相等。即P(0l)P(0)、P(l0)P(1)、P(0)P(1)。6.4 分类器系统(分类器系统(CS-1)Holland给出的在分类器中采用遗传算法的核心步骤:给出的在分类器中采用遗传算法的核心步骤:(1)根据分类器的强度从分类器集合中成对挑选分类器,根据分类器的强度从分类器集合中成对挑选分类器,强度越大,被选出的可
25、能性越大;强度越大,被选出的可能性越大;(2)对选中的分类器对应用交叉、变异算子,生成新的分对选中的分类器对应用交叉、变异算子,生成新的分类器;类器;(3)用生成的后代替换强度最弱的那些分类器。用生成的后代替换强度最弱的那些分类器。6.4 分类器系统(分类器系统(CS-1)分类器系统中的遗传算法:分类器系统中的遗传算法:begin(1)t=0,随机生成集合,随机生成集合Bt,它由,它由M个分类器组成;个分类器组成;(2)计算计算Bt中全体分类器的中全体分类器的平均强度平均强度Vt。对每个分类器赋予一个。对每个分类器赋予一个标准标准化强度值化强度值St(Cj)/Vt。(3)给给Bt中的每个分类器
展开阅读全文