数理统计基础知识课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数理统计基础知识课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 基础知识 课件
- 资源描述:
-
1、12赵选民等,数理统计,科学出版社,2002茆诗松等,概率论与数理统计教程,高等教育出版社,2004中山大学数学系,概率论与数理统计,高等教育出版社,2001吴翊等,应用数理统计,国防科技大学出版社,1995参参 考考 书书 目目3 数理统计与概率论是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象。但在研究问题的方法上有很大区别:但在研究问题的方法上有很大区别:概率论概率论 已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;数理统计数理统计 通过对实验数据的统计分析,寻找所服从的分布和数字特征,从而推断整体的规律性。数理统计的核心问题数理统计的核心问题由样本推断总体由样本
2、推断总体 45概括为两大类 用有效有效的方法去收集数据。抽样理论和试验设计 有效有效地使用数据。中心内容统计推断 它包括参数估计,假设检验,回归分析,方差分析,多元统计分析等等。6 上述有效性有两个含义:可以建立一个在数学上便于处理的模型来描述所得的数据,数据中要包含尽可能多的与所研究的问题有关的信息。7由于统计推断中使用的仅仅是部分数据,且带有随机性,故所得结论只能做到尽可能而非绝对的精确可靠,而结论的正确性程度显然可以用概率来度量,因此概率论是数理统计的基础。统计方法的具体使用并不需要很高深的数学知识,但不具备较多较深的数学知识,这些方法的理论依据就说不清楚。本课主要介绍数理统计方法,也给
3、出一些必要的数学推导,但不追求其严密性和完整性。8数理统计方法的应用数理统计方法的应用 几乎在人类活动的一切领域中都能够不同程度地发现数理统计方法的应用。n实验数据的处理离不开数理统计方法;n在工农业生产中,最佳生产工艺的安排,最佳配方的确定,优良品种的对比试验,产品质量的控制管理,产品验收方案的制定,电子元器件寿命的计算等都要用到数理统计方法。9在医药卫生领域,流行病的研究、新药的药效试验以及某种疾病的发病率与其它因素的关系的研究都是数理统计方法的用武之地。在生物遗传学、气象预报、地震研究、地质探矿等方面的研究中,数理统计方法是必备工具之一。数理统计方法在社会科学方面的应用也愈来愈广泛,教育
4、学,人口学,社会保险业,各种社会问题的抽样调查,市场预测,民意测验等都有数理统计方法涉足。总之,只要安排试验和处理数据,就可以用数理统计方法。10数理统计学发展简史数理统计学发展简史统计学的起源:统计学起源于古代,早在公元前3050年的古埃及就为建造金字塔进行过全国国力统计。到了16世纪,西欧各国政府对收集公民有关资料发生兴趣。Statistics(统计学)源于State.数理统计的正式诞生。在数学家建立了概率论后,才奠定了数理统计发展的理论基础。一般认为,它诞生于19世纪后期。1119世纪后期到20世纪四十年代。在这时期,英国人高尔顿、皮尔逊、费歇等作了大量开创性工作。尤其,费歇于1922年
5、的一篇论文是数理统计学建立过程的一个里程碑,该文主要观点至今仍基本有效。到了四十年代,数理统计学已发展成为一个成熟的数学分支成熟的数学分支,它的重要标志是瑞典统计学家H.Cramer于1949年的著作Mathematical Methods of Statistics12二战后。这时期的一个突出特点是计算机的发明和使用。它使人们能够处理大量的数据及其运算,把数理统计的研究引入到宏观世界和微观世界,又出现了一些新的分支。最后,特别提一下我国的许宝禄教授在极限理论、马氏过程、多元分析、正交设计、过程设计和判别函数等许多方面都有突出的贡献,他的许多研究成果都达到了世界先进水平。13141516条件数
6、学期望n定义定义 设 X是一个r.v.,且EX存在.则记|(|)(|)(|)(|)(iiiX YE X Yyx P Xx YyE X Yyxfx y dx离散情形)连续情形)称E(X|Y=y)为已知Y=y时X的条件期望.n定义定义 设g(y)=E(X|Y=y),随机变量g(Y)就可记作E(X|Y),且称为已知Y时X的条件数学期望。17条件数学期望的性质n如果 X 和 Y 独立,且EX存在,则 E(X|Y)=EXnE(h(Y)|Y)=h(Y)nE(q(X,Y)|Y=y)=E(q(X,y)|Y=y)nE(E(X|Y)=E(X)重期望定理18特征函数n定义定义 称随机变量eitX的数学期望(t)=E
7、eitX为X的特征函数。n随机变量的特征函数(t)是实变量t的复值函数,总是存在的,且与随机变量一一对应。n当X为连续型时,n当X为离散型时,-()()itxtef x dx()=itxkkkkte ppP Xx,19特征函数基本性质(0)1,()(),|()|(0)1;,()()()45ibtYXXtttYaXb a bYteattX(1)(2)特征函数在(-,)上一致连续;(3)若是常数,则 的特征函数,其中是 的特征函数;()两个相互独立的随机变量之和的特征函数等于各个特征函数之积;()两个分布函数相等当且仅当它们所对应的特征函数相等;20()(-)()(),1()-()lim();27
8、()()(0)1;8()()()(0),()iatibtTTTkkkkF xa beeF bF at dtitttXnXtktE Xikn(6)在的连续点上,有 ()函数为特征函数的充要条件是:非负定,连续且()设随机变量 的 阶矩存在,则 的特征函数的 阶导数存在,且 21几个常见随机变量的特征函数12(1)();(2)(,)()();sin(3)-,();(4)()(1);(5)(,),ititnXtqpeXB n ptqpeatXU a atatXittXN 设 服从两点分布,则其特征函数为 设 服从二项分布,则其特征函数为 设则其特征函数为 设 服从参数为 的指数分布,则其特征函数为
9、设则其特征函数为2 212();i ttte22 非降的右连续函数;3 多元随机向量 一、多元随机的分布函数一、多元随机的分布函数1、多元联合分布函数随机向量 的概率分布函数定义为12(,)mXXXX121122(,)(,)mmmF x xxP Xx XxXx 2、联合分布函数的性质121122(,)(,)mmmF x xxP Xx XxXx23 分布函数的取值范围为0,1,即 120(,)1mF x xx 分布函数当变量取值为无穷大时,函数值收敛到1,即(,)1F 24二、两个常用的离散多元分布二、两个常用的离散多元分布 1 1、多项分布、多项分布12(,)mXXXX若有如下分布111221
10、12!(,)!mkkmmmmnP Xk XkXkppk kk,其中10 ipmi,2,1 nkkkm 21121 mppp 则称 服从多项分布。12(,)mXXXX25 2 2、多元超几何分布、多元超几何分布12(,)mXXXX若有如下分布111122(,)mmmmNNkkP Xk XkXkNn),min(,1,0iiNnk 则 服从多元超几何分布。mi,2,1 nkkkm 21NNNNm 2112(,)mXXXX26 三、多元随机变量的概率密度函数三、多元随机变量的概率密度函数1、定义随机向量 的联合分布函数可以表示为12(,)nXXXX1121212(,)(,)nxxnnnF x xxf
11、t tt dt dtdt则称 为连续型随机向量。称为的多元联合概率密度函数。12(,)nf x xx12(,)nXXXX27若 在点 连续,则12(,)nf x xx12(,)nx xx121212(,)(,)nnnnf x xxF x xxx xx 且有11212(,)1nnf x xx dx dxdx28 四、边际分布四、边际分布 设有连续随机向量 12(,)nXXXX不妨设 是 的前q个分量组成。则 的分布为(1)12(,)qXXXX12(,)nXXXX(1)12(,)qXXXX(1)121122(,)(,)qqqFx xxP Xx XxXx11221(,)qqqnP Xx XxXxXX
12、 11212(,)qxxnnf x xx dx dxdx 29112112(,),qxxnqnqf x xx dxdx dx dxdx 所以 的边际密度为(1)12(,)qXXXX(1)1121(,)(,)qnqnfxxf x xx dxdx例 有概率密度函数12(,)XXX)sinsin1(21),(212212221xxexxfxx 试分别求 的边际密度。12,XX11122()(,)f xf x x dx3022122111221()(1 sinsin)2xxf xexx dx22122212211(1 sinsin)22xxeexx dx2223121222222122111sinsi
13、n222xxxxeedxexex dx22121xe1x222221()2xfxe同理1x31五、五、条件分布条件分布 1、问题的引入 若A和B是任意两个事件,且 ,则称为在B事件发生的条件下,事件A发生的条件概率。0)(BP(|)()/()P A BP ABP B考虑随机向量 ,其中 表示人的身高(单位:米),表示人的体重(单位:公斤),在身高为1.9米的人群中,体重 的分布就再也不是原来的分布了。而是在 的条件分布。12(,)XXX1X2X11.90X 2X32 2、条件分布 连续随机向量 不妨设 是 的q个分量组成。是余下的n-q个分量组成。(1)12(,)qXXXX12(,)nXXXX
展开阅读全文