领域知识的获取方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《领域知识的获取方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 领域 知识 获取 方法 课件
- 资源描述:
-
1、 本章主要内容本章主要内容 (1)知识获取的定义和基本原理; (2)主要的知识获取方法,包括:机器学习、数据挖掘与 知识发现; (3)知识获取在智能信息系统中的应用,包括领域知识的 获取、专家知识的获取、用户知识的获取等。 知识获取是人工智能和知识工程的核心技术。知识获取和知识表示是建立、完善和扩展知识库的基础,是利用知识进行推理求解问题的前提。智能信息系统中知识的质量和数量直接影响其系统性能,知识获取成为智能信息系统开发的关键。本章在概述知识获取的基础上,重点讨论机器学习、数据挖掘与知识发现的基本原理与方法,并进一步论述知识获取在智能信息系统中的应用。知识获取定义知识获取定义 所谓知识获取,
2、就是模拟就是模拟人类学习知识的基本过程人类学习知识的基本过程,从信息源中抽取出所需知识,并将其转换成可被计算机程序利用的表示形式。具体说,知识获取就是获得事实、规则及模式的集合,并把它们转换为符合计算机知识表示的形式。信息源主要是人类专家、书本、数据库和网络信息源等。 与信息收集的区别: 信息收集实现信息源浅层内容的获取; 知识获取实现信息源深层知识的获取。知识获取的基本任务知识获取的基本任务 这里通过类比人类学习知识的过程考察知识获取的基本任务。人类学习知识的过程如下图所示。首先,了解基本的领域知识和分析解决问题的方法,即对现有知识的固化记忆;然后,不断在大量的实践活动中进行学习,即对实践数
3、据进行分析、综合,并从实践中总结经验,形成新知识;随后,将新知识与其已有的知识进行融合,逐步精炼、完善和积累知识。知识获取的基本任务:知识获取的基本任务: (通过分析人类学习知识的基本过程) (1)知识抽取)知识抽取。所谓知识抽取是指把蕴含于信息源中的知识经过识别、理解、筛选、归纳等过程抽取出来,并存储于知识库中。 (2)知识建模。)知识建模。知识建模即构建知识模型的过程。构建知识模型的过程可以分为若干个阶段,其中主要的三个阶段是:知识识别、知识规范说明和知识精化。 (3)知识转换)知识转换。所谓知识转换是指把知识由一种表示形式变换为另一种表示形式。如将从专家及文献资料那里抽取的知识转换为产生
4、式规则、框架等知识表示模式。知识获取的基本任务知识获取的基本任务(续)(续) (4)知识存储)知识存储。用适当方式表示知识,并经编辑、编译后存入知识库。 (5)知识检测)知识检测。为保证知识库中知识的一致性、完整性,需要做好对知识的检测。 (6)知识库的重组)知识库的重组。当系统经过一段时间运行后,由于对知识库进行了多次的增、删、改,知识库的结构必然会发生一些变化,需要对知识库中的知识重新进行组织。知识获取方法知识获取方法 知识系统可用多种方法从多种信息源获取知识。如通过与专家会谈、观察专家的问题求解过程、利用智能编辑系统、应用机器学习中的归纳程序、使用文本理解系统等方式,获获取人类专家的知识
5、或将其转换成所需要的形式,也可以取人类专家的知识或将其转换成所需要的形式,也可以从经验数据、实例、出版物、数据库以及网络信息源中获取各种知识。一般来说,按照知识获取的自动化程度按照知识获取的自动化程度,可以将知识可以将知识获取划分为非自动知识获取和自动知识获取两类基本方式获取划分为非自动知识获取和自动知识获取两类基本方式。 (一)非自动知识获取方式 在非自动的知识获取方式中,知识获取分两步进行,首先由知识工程师从相应信息源获取知识;然后再由知识工程师通过某种知识编辑软件将知识输入知识库。其工作方式如下图所示。 (1)知识工程师)知识工程师 知识工程师既懂得如何与领域专家打交道,能从领域专家及有
6、关文献中获得知识系统知识系统所需要的知识,又熟悉知识处理技术。其主要任务是:获取知识系统系统所需要的原始知识;对其进行分析、归纳、整理、升华,用自然语言描述升华,用自然语言描述之;然后由领域专家审查;把最后确定的知识内容知识内容用知识表示语言表示出来,通过知识编辑器进行编辑输入。 (2)知识编辑器)知识编辑器 知识编辑器是一种用于知识编辑和输入编辑和输入的软件,一般采用交互工作方式,其主要功能是: 将获取的知识转换成计算机可表示的内部形式,并输入知识库。 检测知识的错误,包括内容错误和语法错误,例如,知识的正确性、完整性和一致性等。并报告错误性质、原因与部位,以便进行修正。实例:专家系统MYC
7、IN的知识获取 非自动方式是知识库系统建造中用得较普遍的一种知识获取方式。早期专家系统都是运用这种方式建造的,如DENDRAL、MYCIN等。其中,专家系统MYCIN是最具代表性的一个,它用产生式规则作为表示知识的模式,用LISP语言表示规则。其知识获取步骤如下: (1)知识工程师获取专家的知识,用英语描述后输入系统; (2)系统将其翻译为LISP语言的表示形式,然后再用英语的描述形式显示出来,供知识工程师或领域专家检查; (3)如有错误,则由知识工程师与领域专家协商修改,再重复(1)和(2)的工作,直到被确认正确为止; (4)对于新规则,则需检查它与知识库中知识的一致性,有错则修改; (5)
8、将正确的规则送入知识库。 (二)自动知识获取方式 手工获取知识建立知识库是一件相当困难且费时费力的工作,已构成知识工程的瓶颈。为了解决这个难题,人们尝试运用各种理论和方法实现知识的自动化获取。 所谓自动知识获取是指系统采用相关的知识获取方法,直接从信息源“学习”相关的基础知识,以及从系统自身的运行实践中总结、归纳出新知识,不断自我完善,建立起性能优良的知识库。其工作方式如图所示。实现自动知识获取的主要方法:(1)自然语言理解)自然语言理解 自然语言理解方式主要借助于自然语言处理技术,针对文本类型的信息源,通过语法、语义分析,推导文本内容属性,抽取与领域相关的语义实体及其关系,实现知识获取。从本
9、质上说,虽然自然语言理解是最理想的自动知识获取方法,但由于自然语言处理中多项难点技术(如抽词技术、切分词技术、短语识别技术等)尚未得到有效解决,因此,给基于自然语言理解的知识自动获取利用带来一定困难。实现自动知识获取的主要方法:(2)模式识别)模式识别 基于模式识别的知识获取方法主要针对多媒体信息源(如图片、语音波形、符号等),采用统计方法等对事物或现象进行描述、辨认、分类和解释,从经数字化处理后的数据中识别事物对象的特征。(3)机器学习)机器学习 机器学习是系统利用各种学习方法来获取知识,是一种高级的全自动化的知识获取方法。机器学习还具有从运行实践中学习的能力,能纠正可能存在的错误,产生新的
10、知识,从而不断进行知识库的积累、修改和扩充。(4)数据挖掘与知识发现)数据挖掘与知识发现 基于数据挖掘的知识获取是近几年发展起来的新方法,它主要针对结构化的数据库,采用统计学习等定量化分析方法,发现大量数据之间所存在的关联。虽然数据挖掘与机器学习都是从数据中提取知识,但两者之间存在区别:机器学习主要针对特定模式的数据进行学习;数据挖掘则是从实际的海量数据源中发现、抽取知识。由于数据挖掘技术简单易行,目前已逐步发展成为金融业、保险业、零售业、电信、生物等领域中颇具影响力的知识获取工具。(5)机器感知)机器感知 基于机器感知的知识获取主要依靠机器的视觉、听觉、触觉、味觉等传感器获取生理及行为特征信
11、号,直接感知外部世界。它需要采用人工智能方法和技术,观测、建模、识别外界信息,从而创建感知能力。机器感知是一项高智能的活动,比自然语言理解、模式识别具有更复杂的能力,目前还只是处于探索中。 本章将主要论述机器学习和数据挖掘这两类方法。本章将主要论述机器学习和数据挖掘这两类方法。自动知识获取方式的展望 自动知识获取是一种理想的知识获取方式,它涉及到人工智能的多个研究领域,如模式识别、自然语言理解、机器学习等,对硬件亦有较高的要求。而目前这些领域尚处于研究阶段,有许多理论及技术上的问题需要做进一步的研究,就目前已经取得的研究成果而言,尚不足以真正实现自动知识获取。因此,知识的完全自动获取目前还只能
12、作为人们为之奋斗的目标。 机器学习是人工智能研究中的一个重要领域。学习是一种自然的认识处理,是人(或计算机)增长知识和改善其技能的方法。如果一个计算机系统具有学习能力,它就可以自动改进自身的执行性能而不需要重新进行程序设计。概述概述(一)研究及其学习的目的 (1)开发学习的理论,模拟人类学习处理的认知模型,进行理论分析和学开发学习的理论,模拟人类学习处理的认知模型,进行理论分析和学习方法的探索。习方法的探索。 (2)构造学习机器和具有学习能力的知识系统,帮助人类解决困难的社会、技术和科学问题。(二)机器学习研究的主要内容机器学习研究的主要内容 (1)学习机理的研究。这是对人类学习机制的研究,即
13、人类获取知识、技能和抽象概念的天赋能力。通过这一研究,可以指导机器学习,以便解决机器学习中存在的相关问题。 (2)学习方法与技术的研究。研究人类的学习过程,探索各种可能的学习方法,建立起独立于具体应用领域的学习算法。 (3)机器学习系统及应用研究。根据特定任务要求,建立相应的学习系统。(三)机器学习的作用 (1)获取新知识获取新知识。学习可看作一种创造活动,可以获取说明型知识、经验知识和技能。机器学习可以归纳新知识,如发现人类未曾想到过的新概念和模型,可以缩短从专家处获取知识的历程。 (2)精炼知识库精炼知识库。完全自动化的知识获取是困难的,利用机器学习维护知识库的完整性和一致性是较容易实现的
14、。通过学习不仅可以发现知识库中的错误和缺陷,还可以优化和简化知识。例如,参数学习系统中,当知识表示为函数,可用于发现好的参数或可信值集合。 (3)辅助查找处理辅助查找处理。当查找空间很大,描述很多,就可能产生组合爆炸问题。因此,需要学习有效的启发式知识引导查找,忽略大量与目标无关的描述或概念,也就是将学习作为一种查找处理。 (4)形成新理论形成新理论。探索新知识可被看作理论形成的处理。理论形成的一个方面是归纳推理,从具体实例推导一般规律(假设)。理论形成的另一方面是验证假设,寻找与一般理论的上下文有关的事实证据,并且比较多种可能的假设来选择较好的。(四)机器学习所用到的推理方法 目前机器学习所
15、用到的推理方法可分为三大类:基于演绎的保真性推理基于归纳的从个别到一般的推理基于类比的从个别到个别的推理 不同的学习系统采用不同的推理方法。早期的机器学习系统一般采用单一的推理学习方法,而现在则趋于采用多种推理技术支持的学习方法。学习中使用的推理越多,表明系统的学习能力越强。(五)机器学习的类型 根据学习原理,机器学习类型如下: (1)机械学习机械学习(Rote Learning) 机械学习是最简单的学习策略。这种学习策略不需要任何推理过程。通过提供人机接口,将外界的知识按照系统内部的知识表示方法进行组织,由于所输入的知识的表示方式与内部完全一致,不需要任何处理和转换就可以直接存储并提供给用户
16、检索和使用。机械学习中,环境所提供的知识与执行环节中使用的知识有着相同的形式和水平。虽然机械学习在方法上看来简单,但由于计算机的存储容量较大,检索速度较快,而且记忆准确,所以也产生较好的效果。如Samuel西洋象棋程序就是采用了这种机械记忆策略,它记忆每个棋局以便提高下棋水平。(2)指导学习指导学习(Learning from Instruction) 就是对知识进行简单的语法转换,将它同化为已描述的知识结构(模型、框架等)。对于使用传授学习策略的系统来说,外界所输入知识的表示方式与内部知识的表示方式不完全一致,系统在接受外部知识时需要一定的推理、翻译和转化工作。MYCIN、DENDRAL等专
17、家系统在获取知识上都采用这种学习策略。(3)归纳学习归纳学习(Inductive Learning) 归纳学习是研究最广的一种符号学习方法。归纳学习采用归纳推理。归纳推理是从部分到全体,从特殊到一般的推理过程。在进行归纳学习时,学习者从所提供的事实或观察到的假设进行归纳推理,获得某个概念。应用归纳推理,系统可从环境提供的具体事实中获取知识。(4)演绎学习()演绎学习(Deductive Learning) 演绎学习中,学习系统进行演绎推理,从源信息和它的背景知识中推导出所需要的知识。(5)类比学习()类比学习(Learning by Analogy) 类比是一种很有效的推理方法,它能够清晰简洁
18、地描述对象间的相似性。为了使类比系统能够获得类似任务的有关知识,要求类比学习系统必须能够发现当前任务与已知任务的相似之处,并由此制定完成当前任务的方案,可看作是归纳和演绎学习的综合方法。(6)基于案例的学习()基于案例的学习(Case-Based Learning) 计算机系统在执行任务的过程中,常接受、处理和积累大量的具体案例及过程。要求系统通过案例进行学习,需要对这些例子的工作模式与经验进行分析、总结和推广,得到完成任务的一般性规律,并在进一步的工作中验证或修改这些规律。机器学习系统的原理、结构和功能机器学习系统的原理、结构和功能(一)机器学习系统 根据人类学习的原理和方法,机器学习系统需
19、要通过学习增长其知识、改善其性能、提高其智能水平。机器学习系统在不同的学习环境、不同的应用条件下,一般也存在差异。例如,专家系统中的知识获取,主要是获取专家的知识。而对于博弈系统,在与对手较量的过程中,需要了解对方的长处与弱势,从失败与成功的案例中总结经验教训并将其转换为内在的知识。机器学习系统在学习过程中,需要使用合适的学习方法,通过与环境多次交互,逐步达到一定的知识水平和求解问题的能力,从而改善系统的性能。在获取知识过程中,机器学习系统中应设置知识库、人机接口等功能。(二)机器学习系统的结构和功能 机器学习系统的类型很多,但它们具有一些共同的要素。图中给出了学习系统的一般构架,它包含5个主
20、要部分:环境、控制与评价、学习、知识库和执行机制。系统各部分简要描述如下:(1)知识库(Knowledge Base) 用于存储、积累系统的知识,它包括规则集合、参数值、符号结构等,供执行机制使用。它还具有知识增删、修改、扩充等功能。知识库可组织为两个级别:长期存储器(Long Term Memory)和短期存储器(Short Term Memory)。长期存储器存储较永久性的知识,它们是系统必须具备的先验背景知识。短期存储器存放学习过程中的初始数据、中间结果等。(2)学习部分(Learner) 学习部分是系统的核心部件,必须具备以下2个主要功能:进行学习推理。利用输入信息、评价指导信息和多种
21、学习策略,进行学习过程的知识推理,获得有关问题的解答和结论。学习部分还应能修改知识库,纠正系统的错误执行,自动改进系统的执行性能。(3)执行机制(Performer) 该部分使用已学习到的知识去完成所规定的任务。它以各种方法运用知识库中的规则引导系统的活动。例如,当学习过程修改了知识库中的知识,系统行为将要随之改变。(4)控制与评价(Control and Critic) 该部分的首要任务是评价系统执行性能,通过将系统的实际结果与先验理想模型相比较,找出误差,分析错误,检测系统执行效果。然后,系统根据评价和检测结果,将信息反馈给学习部分,对学习进行指导,并控制输入信息的改进。(5)环境(Env
22、ironment) 环境指获取信息和知识的来源,包括实例集合、已存在的实例数据库、人类专家等信息源。 除了以上5个主要部件之外,与学习系统有关的其它2个元素是描述语言和实例集合的选择。 (1)描述语言是系统知识的表达机制。描述语言必须适用于知识获取,应能表达系统中的两类重要知识:一类是输入实例;另一类是系统产生的规则。知识的表示形式应易理解、易转换。 (2)实例集合的选取对于学习系统是很重要的。很显然,系统需要一个训练实例集合,依据这些实例,系统推导与输入描述相关的规则或规则集。但是,系统产生的规则必须被检测。因此系统还必须有另一个检测实例集合,若规则能成功地应用于这些新的实例,则会提高规则的
23、可信度。基于归纳的学习基于归纳的学习 所谓归纳学习,就是系统根据有关的数据或实例,应用归纳推理推导出一般性规则或结论。系统可通过实例学习,还可通过观察样品和通过发现而学习。归纳学习可以迅速地产生知识库,是一种实验成功的、有效的自动化学习方法。(一)归纳学习的原理归纳学习的原理 归纳学习是通过执行归纳推理来实现的。什么是归纳推理呢?如图所示,归纳推理就是从已知事实和背景知识推导出结论的处理过程,该结论描述已知事实。归纳推理是由特殊到一般,若推导出的规则是正确的,那么不仅可将它用于其它特例,还可用于一般情况。适合于学习系统的归纳推理规则可分为以下两大类型: (1)选择归纳 选择归纳包括 : 减少条
24、件:就是从AND操作符连接的表达式中删掉一个或几个条件,那么所得规则比原规则较一般化。例如, 原规则:如果如果 一个学生又聪明又很勤奋 那么那么 他的学习一定很好。 新规则:如果如果 一个学生很勤奋 那么那么 他的学习一定很好。 将常量转换为变量:将事实描述或规则条件中的常量代换为一个变量。例如,likes(Liming, football)转为likes(X, football),则变量X可代表任何一个人,即任何一个人都喜欢足球。 增加选择项:就是将可能的情形用OR操作符号连入规则的条件中。例如Flag(X)= Red,转为Flag(X)= Red OR Blue。 转换AND为OR:就是将
25、条件中的AND操作符转为OR操作符。例如A AND B,转为A OR B。 应用“相对扩展(Extend Against)”操作,扩展规则的条件。(2)构造归纳 构造归纳包括: 计算参数满足一个条件,例如曲线拟合法,可从已存实例推导出新规则。例如,对于(X, Y, Z)三元组有以下三个实例: 实例1:(0, 2, 7) 实例2:(6, 1, 10) 实例3:(1, 5, 16) 其中X、Y是输入,Z是输出。采用最小平方回归分析,可推出规则:Z = 2X+3Y+1。 探索概念之间的从属关系,用较广义的概念代换较狭义的概念。例如用“图书馆”代换“大学图书馆”。 用蕴含性质代换一个性质。例如,A蕴含
展开阅读全文