人工智能09贝叶斯网络(57张)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《人工智能09贝叶斯网络(57张)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 09 贝叶斯 网络 57 课件
- 资源描述:
-
1、Bayesian networks贝叶斯网络Frequentist vs.Bayesian客观 vs.主观Frequentist(频率主义者):概率是长期的预期出现频率.P(A)=n/N,where n is the number of times event A occurs in N opportunities.“某事发生的概率是0.1”意味着0.1是在无穷多样本的极限条件下能够被观察到的比例但是,在许多情景下不可能进行重复试验发生第三次世界大战的概率是多少?Bayesian:degree of belief.It is a measure of the plausibility(似然性)
2、of an event given incomplete knowledge.相信的程度,是在不确定知识的环境下对事件似然性的衡量Probability概率Probability is a rigorous formalism for uncertain knowledge概率是对不确定知识一种严密的形式化方法Joint probability distribution specifies probability of every atomic event全联合概率分布指定了对随机变量的每种完全赋值,即每个原子事件的概率Queries can be answered by summing ov
3、er atomic events可以通过把对应于查询命题的原子事件的条目相加的方式来回答查询For nontrivial domains,we must find a way to reduce the joint sizeIndependence and conditional independence provide the toolsIndependence/Conditional IndependenceA and B are independent iffP(A|B)=P(A)or P(B|A)=P(B)or P(A,B)=P(A)P(B)A is conditionally ind
4、ependent of B given C:P(A|B,C)=P(A|C)在大多数情况下,使用条件独立性能将全联合概率的表示由n的指数关系减为n的线性关系。Conditional independence is our most basic and robust form of knowledge about uncertain environments.Probability TheoryProbability theory can be expressed in terms of two simple equations概率理论可使用两个简单线性方程来表达 Sum Rule(加法规则)变量
5、的概率是通过边缘化或者求和其他变量获得的 Product Rule(乘法规则)用条件表达联合概率所有的概率推理和学习相当于不断重复加法和乘法法则大纲 Graphical models(概率图模型)Bayesian networks Syntax(语法)Semantics(语义)Inference(推导)in Bayesian networks什么是图模型?概率分布的图表示 概率论和图论的结合 Also called 概率图模型 They augment analysis instead of using purealgebra(代数)What is a Graph?Consists of no
6、des(also called vertices)and links(also called edges or arcs)在概率图模型中 每个节点表示一个随机变量(or 一组随机变量)边表示变量间的概率关系Graphical Models in CS 处理不确定性和复杂性的天然工具贯穿整个应用数学和工程领域 图模型中最重要的思想是模块性概念 a complex system is built by combining simpler parts.Why are Graphical Models useful 概率理论提供了“黏合剂”whereby 使每个部分连接起来,确保系统作为一个整体是一致
7、的 提供模型到数据的连接方法.图理论方面提供:直观的接口 by which humans can model highly-interacting sets of variables 数据结构 that lends itself naturally to designing efficient general-purpose(通用的)algorithmsGraphical models:统一的框架 考虑传统的多变量的概率系统作为一般基础形式的实例 mixture models(混合模型),factor analysis(因子分析),hidden Markov models,Kalman fil
8、ters(卡尔曼滤波器),etc.在系统工程,信息论,模式识别和统计力学中被用到 优势:在某一领域中的专业技术能够在该领域中相互转化并被充分利用 Provides natural framework for designing new systems图模型在机器学习中的角色1.形象化概率模型结构的简单方法2.Insights into properties of modelConditional independence properties by inspecting graph3.执行推理和学习表示为图形化操作需要复杂的计算图的方向性 有向图模型 方向取决于箭头 贝叶斯网络 随机变量间的因
9、果关系 More popular in AI andstatistics 无向图模型 边没有箭头 Markov random fields(马尔科夫随机场)更适合表达变量之间的软约束 More popular in Vision and physicsBayesian networks一种简单的,图形化的数据结构,用于表示变量之间的依赖关系(条件独立性),为任何全联合概率分布提供一种简明的规范。Syntax语法:a set of nodes,one per variablea directed(有向),acyclic(无环)graph(link direct influences)a cond
10、itional distribution for each node given its parents:P(Xi|Parents(Xi)量化其父节点对该节点的影响In the simplest case,conditional distribution represented as aconditional probability table 条件概率表(CPT)giving thedistribution over Xi for each combination of parent valuesExampleTopology(拓扑结构)of network encodes conditio
11、nal independence assertions:Weather 独立于其他变量Toothache and Catch are conditionally independent given CavityExample我晚上在单位上班,此时邻居John给我打电话说我家警报响了,但是邻居Mary没有给打电话。有时轻微的地震也会引起警报。那么我家真正遭贼了吗?Variables:Burglary(入室行窃),Earthquake,Alarm,JohnCalls,MaryCalls网络拓扑结构反映出因果关系:A burglar can set the alarm off An earthqua
12、ke can set the alarm off The alarm can cause Mary to call The alarm can cause John to callExample contd.Compactness(紧致性)A CPT for Boolean Xi with k Boolean parents has 2k rows for the combinations of parent values一个具有k个布尔父节点的布尔变量的条件概率表中有2k个独立的可指定概率Each row requires one number p for Xi=true(the numbe
13、r for Xi=false is just 1-p)If each variable has no more than k parents,the complete network requires O(n 2k)numbersI.e.,grows linearly with n,vs.O(2n)for the full joint distributionFor burglary net,1+1+4+2+2=10 numbers(vs.25-1=31)Global semantics(全局语义)The full joint distribution is defined as the pr
14、oduct of the local conditional distributions:全联合概率分布可以表示为贝叶斯网络中的条件概率分布的乘积Global semantics(全局语义)The full joint distribution is defined as the product of the local conditional distributions:全联合概率分布可以表示为贝叶斯网络中的条件概率分布的乘积Local semanticsLocal semantics:each node is conditionally independent of its nondesc
15、endants(非后代)given its parents给定父节点,一个节点与它的非后代节点是条件独立的Theorem:Local semantics global semanticsCausal Chains因果链 一个基本形式:Is X independent of Z given Y?Evidence along the chain“blocks”the influenceCommon Cause共同原因 另一个基础的形态:twoeffects of the same cause Are X and Z independent?Are X and Z independent given
展开阅读全文