贝叶斯统计第一章课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《贝叶斯统计第一章课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贝叶斯 统计 第一章 课件
- 资源描述:
-
1、贝叶斯统计贝叶斯统计统计与数学学院统计与数学学院 贝叶斯统计贝叶斯统计茆诗松编,贝叶斯统计茆诗松编,贝叶斯统计,中国统计出版社,中国统计出版社,2005年年.1 贝叶斯统计与决策贝叶斯统计与决策Berger J O中国统计出版中国统计出版社社1998 2 现代贝叶斯统计现代贝叶斯统计Kotz S,吴喜之中国统计出版吴喜之中国统计出版社社19993 贝叶斯统计推断张尧庭、陈汉峰科学出版贝叶斯统计推断张尧庭、陈汉峰科学出版社社1991伽玛函数伽玛函数函数函数dxexx10)(伽玛函数的性质伽玛函数的性质:)21(;1)1()1()()1()2(1()()!nnnnn 当当 为为自自然然数数 时时,
2、有有伽玛分布伽玛分布0,00,)()(1xxexxpx0011xxE Xx edxxedx()()()()()(1)1()2()E X 2(1)222()()()Var XE XE X 5.4.4 伽玛分布的两个特例伽玛分布的两个特例1.当当=1时时,伽玛分布就是指数分布伽玛分布就是指数分布:)(),1(ExpGa)()21,2(2nnGa0,00,)()(1xxexxpx0()00 xexp xx (,)Ga 12221,0()2()20,0 xnnexxnp xx ),(2nX若则则X的密度函数为的密度函数为(),()2E XnVar Xn1000,()(),xxexp xx 2(),()
3、E XVar X (,)XGa )()21,2(2nnGa贝塔函数贝塔函数函数函数dxxxbaBba1110)1(),(贝塔函数的性质贝塔函数的性质:),(),()1(abBbaB)()()(),()2(bababaB),(),()1(abBbaBdxxxbaBba1110)1(),()()1(11101ydyyxybadyyyba1110)1(),(abB证明)()()(),()2(bababaB证明dxdyeyxbayxba)(1100)()(ududvevuuvvuyuvxuba11100)1()()1(,dvvvdueubauba111010)1(),()(baBba11()(1),0
4、1()()()0,ababxxxabp x其它 贝塔分布贝塔分布贝塔分布的数学期望和方差贝塔分布的数学期望和方差1101()()()()()ababE Xxxdxab 11()()()()()()ababababaab (,)XBe a b若若2()E X11()()()a aab ab 2()()(1)abVar Xabab(Bayes,Thomas)(17021761)贝叶斯是英国数学家贝叶斯是英国数学家.1702年生于伦敦;年生于伦敦;1761年年4月月17日日卒于坦布里奇韦尔斯卒于坦布里奇韦尔斯.贝叶斯是一位自学成才的数学家贝叶斯是一位自学成才的数学家.曾助理宗教事务,后来曾助理宗教事
5、务,后来长期担任坦布里奇韦尔斯地方教堂的牧师长期担任坦布里奇韦尔斯地方教堂的牧师.1742年,贝叶斯被年,贝叶斯被选为英国皇家学会会员选为英国皇家学会会员.如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计等等叶斯估计量、贝叶斯方法、贝叶斯统计等等.贝叶斯方法(Bayesian approach)贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述和解决统计问题的方法(Samuel Kotz和吴喜之,2000)
6、。贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数(茆诗松和王静龙等,1998年)。“贝叶斯提出了一种归纳推理的理论(贝叶斯定理),以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法.”摘自中国大百科全书(数学卷)源于源于1763年贝叶斯在年贝叶斯在论有关机遇问题的求解论有关机遇问题的求解中提出一种归纳推理的理论。中提出一种归纳推理的理论。采用贝叶斯方法方法作统计推断所得的全部结果,采用贝叶斯方法方法作统计推断所得的全部结果,构成贝叶斯统计的内容。构成贝叶斯统计的内容。贝叶斯学派学者认为贝叶斯方法是唯一合理
7、的统贝叶斯学派学者认为贝叶斯方法是唯一合理的统计推断方法,其形成可追溯到计推断方法,其形成可追溯到 20世纪世纪 30 年代。年代。到到5060年代,已发展为一个有影响的学派。年代,已发展为一个有影响的学派。本书共六章,可分二部分。前三章围绕先验分本书共六章,可分二部分。前三章围绕先验分布介绍贝叶斯推断方法。后三章围绕损失函数介绍布介绍贝叶斯推断方法。后三章围绕损失函数介绍贝叶斯决策方法。阅读这些内容仅需要概率统计基贝叶斯决策方法。阅读这些内容仅需要概率统计基本知识就够了。本知识就够了。Byaes统计学派与经典统计学派虽然有很大区别,统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各
8、有其适用的范围,作为研但是它们各有优缺点,各有其适用的范围,作为研究者一定要博采众长,以获得一种更适合解决实际究者一定要博采众长,以获得一种更适合解决实际问题的方法。而且,在不少情况下,二者得出的结问题的方法。而且,在不少情况下,二者得出的结论在形式上是相同的。论在形式上是相同的。一一 第一章第一章 先验分布与后验分布先验分布与后验分布 统计学中有两个主要学派:频率学派与贝叶斯统计学中有两个主要学派:频率学派与贝叶斯学派。下面从统计推断的三种信息来说明他们之学派。下面从统计推断的三种信息来说明他们之间的区别与联系。间的区别与联系。经典学派经典学派的观点:的观点:统计推断是根据样本信息统计推断是
9、根据样本信息对总体分布或总体的特征数进行推断,这里对总体分布或总体的特征数进行推断,这里用到两种信息:用到两种信息:总体信息总体信息和和样本信息样本信息;贝叶斯学派贝叶斯学派的观点:除了上述两种信息以外,的观点:除了上述两种信息以外,统计推断还应该使用第三种信息:统计推断还应该使用第三种信息:先验信息先验信息。1.1 三种信息三种信息 一、总体信息一、总体信息,即总体分布或总体所属分布给我,即总体分布或总体所属分布给我们的信息。们的信息。例如例如:”总体是正态分布总体是正态分布“说明说明:总体信息是很重要的信息,为了获取此种:总体信息是很重要的信息,为了获取此种信息往往耗资巨大。信息往往耗资巨
10、大。1.1 三种信息三种信息 二、样本信息,二、样本信息,即从总体抽取的样本给我们的信即从总体抽取的样本给我们的信息。(愈多愈好)息。(愈多愈好)人们希望通过对样本的加工和处理对总体的某些人们希望通过对样本的加工和处理对总体的某些特征做出较为精确的统计推断。特征做出较为精确的统计推断。例:有了样本观察值,我们可根据它大概知道总例:有了样本观察值,我们可根据它大概知道总体的一些特征数(均值、方差等)在一个什么范体的一些特征数(均值、方差等)在一个什么范围内。围内。经典统计学经典统计学:基于以上两种信息进行的统计推断被:基于以上两种信息进行的统计推断被称为称为经典统计学经典统计学。说明:说明:它的
11、基本观点是把数据(样本)看成是来自它的基本观点是把数据(样本)看成是来自具有一定概率分布的总体,所研究对象是这个总体而具有一定概率分布的总体,所研究对象是这个总体而不局限于数据本身。不局限于数据本身。据现有资料看,这方面最早的工作是高斯和勒让德据现有资料看,这方面最早的工作是高斯和勒让德德误差分析、正态分布和最小二乘法。从十九世纪末德误差分析、正态分布和最小二乘法。从十九世纪末期到二十世纪中叶,经皮尔逊、费歇和奈曼等人杰出期到二十世纪中叶,经皮尔逊、费歇和奈曼等人杰出的工作创立了经典统计学。的工作创立了经典统计学。随着经典统计学的持续发展与广泛应用,它本身的随着经典统计学的持续发展与广泛应用,
12、它本身的缺陷也逐渐暴露出来了。缺陷也逐渐暴露出来了。(1)总体信息:总体分布提供的信息。(2)样本信息:抽取样本所得观测值提供的信息。(3)先验信息:人们在试验之前对要做的问题在经 验上和资料上总是有所了解的,这些信息对 统计推断是有益的。先验信息即是抽样(试 验)之前有关统计问题的一些信息。一般说 来,先验信息来源于经验和历史资料。先验 信息在日常生活和工作中是很重要的。贝叶斯学派贝叶斯学派的观点:除了上述两种信息以外,统的观点:除了上述两种信息以外,统计推断还应该使用第三种信息:计推断还应该使用第三种信息:先验信息先验信息。三、先验信息,三、先验信息,即是抽样(试验)之前有关统计即是抽样(
13、试验)之前有关统计问题的一些信息。问题的一些信息。一般说来,先验信息来源于经验和历史资料。先一般说来,先验信息来源于经验和历史资料。先验验 信息在日常生活和工作中是很重要的。信息在日常生活和工作中是很重要的。人们在试验之前对要做的问题在经人们在试验之前对要做的问题在经 验上和资料上验上和资料上总是有所了解的,这些信息对总是有所了解的,这些信息对 统计推断是有益的。统计推断是有益的。例例1.11.1 英国统计学家英国统计学家SavageSavage曾考察如下曾考察如下2 2个统计实验:个统计实验:A A。一位常饮牛奶加茶的妇女声称,她能辨别先倒进。一位常饮牛奶加茶的妇女声称,她能辨别先倒进杯子里
14、的是茶还是牛奶。对此做了杯子里的是茶还是牛奶。对此做了1010次试验,她都次试验,她都正确地说出了。正确地说出了。B B。一位音乐家声称,他能从一页乐谱辨别出是海顿。一位音乐家声称,他能从一页乐谱辨别出是海顿还是莫扎特的作品。在还是莫扎特的作品。在1010次这样的试验中,他都能次这样的试验中,他都能正确辨别。正确辨别。在这两个统计试验中,假如认为被试验者是在猜在这两个统计试验中,假如认为被试验者是在猜测,每次成功的概率为测,每次成功的概率为0.50.5,那么,那么1010次都猜中的概次都猜中的概率为率为2-10=0.00097662-10=0.0009766,这是一个很小的概率,是,这是一个很
15、小的概率,是几乎不可能发生的,所以几乎不可能发生的,所以“每次成功概率为每次成功概率为0.5”0.5”的假设应该被拒绝。的假设应该被拒绝。被试验者每次成功的概率要比被试验者每次成功的概率要比0.50.5大得多。这不是大得多。这不是猜测,而是他们的经验在帮了他们的忙。猜测,而是他们的经验在帮了他们的忙。例例1.2 1.2“免检产品免检产品”是怎样决定的?某厂的产品每天都是怎样决定的?某厂的产品每天都有抽验几件,获得不合格品率有抽验几件,获得不合格品率的估计。在经过一段时的估计。在经过一段时间后就积累大量的资料,根据这些历史资料(先验信息间后就积累大量的资料,根据这些历史资料(先验信息的一种)对过
16、去产品的不合格品率可构造一个分布:的一种)对过去产品的不合格品率可构造一个分布:niniPi,.,1,0,)(这个对先验信息进行加工获得的分布今后称为这个对先验信息进行加工获得的分布今后称为先验分布先验分布。如果这个分布的概率大部分集中在如果这个分布的概率大部分集中在=0附近,那么该产附近,那么该产品可认为是品可认为是“信得过产品信得过产品”。假如以后的多次抽检结果与历史资料提供的先假如以后的多次抽检结果与历史资料提供的先验分布是一致的。使用单位就可以对它做出验分布是一致的。使用单位就可以对它做出“免检免检产产品品”的决定,或者每月抽检一、二次就足够了,这的决定,或者每月抽检一、二次就足够了,
17、这就就省去了大量的人力和物力。省去了大量的人力和物力。贝叶斯统计学:贝叶斯统计学:基于上述三种信息进行统计推断的统计基于上述三种信息进行统计推断的统计学称为。它与经典统计学的学称为。它与经典统计学的差别差别就在于是否利用先验信就在于是否利用先验信息。息。贝叶斯统计在重视使用总体信息和样本信息的同时,贝叶斯统计在重视使用总体信息和样本信息的同时,还注意先验信息的收集、挖掘和加工,使它数量化,形还注意先验信息的收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的成先验分布,参加到统计推断中来,以提高统计推断的质量。质量。忽视先验信息的利用,有时是一种浪费,有时还会忽视先
18、验信息的利用,有时是一种浪费,有时还会导出不合理的结论。导出不合理的结论。在使用在使用样本信息上也是有差异的样本信息上也是有差异的.贝叶斯学派重视已贝叶斯学派重视已出现的样本观察值出现的样本观察值,而对尚未发生的样本观察值不予考而对尚未发生的样本观察值不予考虑虑.贝叶斯学派的基本观点贝叶斯学派的基本观点:任一未知量任一未知量都可看作随机变都可看作随机变量,量,可用一个概率分布去描述,这个分布称为先验分布;可用一个概率分布去描述,这个分布称为先验分布;在获得样本之后,总体分布、样本与先验分布通过贝叶在获得样本之后,总体分布、样本与先验分布通过贝叶斯公式结合起来得到一个关于未知量斯公式结合起来得到
19、一个关于未知量新的分布新的分布后验后验分布分布;任何关于;任何关于的统计推断都应该基于的统计推断都应该基于的后验分布的后验分布进行。进行。因为任一未知量都有不确定性,而在表述不确因为任一未知量都有不确定性,而在表述不确定性程度时,概率与概率分布是最好的语言。定性程度时,概率与概率分布是最好的语言。例例1.21.2中产品的不合格品率中产品的不合格品率是未知量,但每天都是未知量,但每天都有一些变化,把它看做一个随机变量是合适的,有一些变化,把它看做一个随机变量是合适的,用一个概率分布去描述它也是很恰当的。用一个概率分布去描述它也是很恰当的。例例1.3 1.3 学生估计一新教师的年龄。学生估计一新教
20、师的年龄。依据学生们的生活经历,在看了新教师的照片后会立依据学生们的生活经历,在看了新教师的照片后会立即有反应:即有反应:“新教师的年龄在新教师的年龄在3030岁到岁到5050岁之间,极有岁之间,极有可能在可能在4040岁左右。岁左右。”一位统计学家与学生们交谈,明一位统计学家与学生们交谈,明确这句话中确这句话中“左右左右”为为3 3岁,岁,“极有可能极有可能”可理解为可理解为9090的把握。于是学生们对新教师的年龄(未知量)的把握。于是学生们对新教师的年龄(未知量)的认识(先验信息)可综合为图的认识(先验信息)可综合为图1.11.1所示的概率分布,所示的概率分布,这也是学生们对未知量(新教师
21、的年龄)的概率表述。这也是学生们对未知量(新教师的年龄)的概率表述。这里有两个问题需要进一步讨论。这里有两个问题需要进一步讨论。第一,按图第一,按图1.11.1所示的概率分布我们可谈论未知量所示的概率分布我们可谈论未知量位于某个区间的概率。位于某个区间的概率。位于位于3737到到4343岁间的概率为岁间的概率为0.90.9。可这个陈述在经。可这个陈述在经典统计中是不允许的。在实际中类似的说法经常听典统计中是不允许的。在实际中类似的说法经常听到。到。第二,按图第二,按图1.11.1中的概率不是在大量重复试验中获得的,中的概率不是在大量重复试验中获得的,而是学生们根据自己的生活经历的积累对该事件发
22、生可而是学生们根据自己的生活经历的积累对该事件发生可能性所给出的信念,这样给出的概率在贝叶斯统计中是能性所给出的信念,这样给出的概率在贝叶斯统计中是允许的,并称为允许的,并称为主观概率主观概率。(它也符合概率的三条公。(它也符合概率的三条公理)。这一点频率学派是频率学派难以接受的,他们认理)。这一点频率学派是频率学派难以接受的,他们认为经典统计学使用大量重复试验的频率来确定概率,是为经典统计学使用大量重复试验的频率来确定概率,是“客观的客观的”,因此符合科学的要求,而认为贝叶斯统计,因此符合科学的要求,而认为贝叶斯统计是是“主观的主观的”,因而(至多)只对个人决策有用。这是,因而(至多)只对个
23、人决策有用。这是当前对贝叶斯统计的主要批评。当前对贝叶斯统计的主要批评。两学派在一些问题上的争论将在后面逐步介绍。两学派在一些问题上的争论将在后面逐步介绍。ByaesByaes统计学派与经典统计学派分歧统计学派与经典统计学派分歧第一,是否利用先验信息。由于产品的设计、生产都有第一,是否利用先验信息。由于产品的设计、生产都有一定的继承性,这样就存在许多相关产品的信息以及先一定的继承性,这样就存在许多相关产品的信息以及先验信息可以利用,验信息可以利用,ByaesByaes统计学派认为利用这些先验信统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高息不仅可以减少样本容量,而且
24、在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。统计精度;而经典统计学派忽略了这些信息。第二,是否将参数第二,是否将参数 看成随机变量。看成随机变量。ByaesByaes统计学派的最统计学派的最基本的观点是基本的观点是:任一未知量任一未知量 都可以看成随机变量,可以都可以看成随机变量,可以用一个概率分布去描述,这个分布就是先验分布。因为用一个概率分布去描述,这个分布就是先验分布。因为任一未知量都具有不确定性,而在表述不确定性时,概任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把率与概率分布是最好的语言;相反,经典统计学派却把未知量未知
25、量就简单看成一个未知参数,来对它进行统计推就简单看成一个未知参数,来对它进行统计推断。断。总结总结 理解贝叶斯统计学与经典统计学的主要差理解贝叶斯统计学与经典统计学的主要差别。别。贝叶斯统计学派的最基本的观点贝叶斯统计学派的最基本的观点。1.2 贝叶斯公式贝叶斯公式一、贝叶斯一、贝叶斯 公式的密度函数形式公式的密度函数形式1.1.总体依赖于参数总体依赖于参数的概率函数在贝叶斯统计中记的概率函数在贝叶斯统计中记为为p(x|),它表示在随机变量,它表示在随机变量取某个给定值取某个给定值时总体的时总体的条件概率函数;条件概率函数;2.2.根据参数根据参数的先验信息可确定的先验信息可确定先验分布先验分
展开阅读全文