概率与抽样分布培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《概率与抽样分布培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 抽样 分布 培训 课件
- 资源描述:
-
1、第3章 概率与抽样分布Probability and Sampling Distributions精品Section 3.1Random Variables随机变量精品 事件事件的实际发生率的实际发生率称为称为频率频率。设在相同。设在相同条件下,独立重复进行条件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f/n n。概率概率:随机事件发生的可能性大小随机事件发生的可能性大小,用,用大写的大写的P P 表示;取值表示;取值00,11。一、频率与概率frequency and probability精品 1.样本频率总是
2、围绕概率上下波动 2.样本含量n越大,波动幅度越小,频率越接近概率。频率与概率的关系:调查株数调查株数(n)52550100200500100015002000受害株数受害株数(a)21215 33 72177 351 525 704棉株受害频棉株受害频率率(a/n)0.400.480.300.330.360.3540.3510.3500.352表表 在相同条件下盲蝽象在某棉田危害程度的调查结果在相同条件下盲蝽象在某棉田危害程度的调查结果一、频率与概率frequency and probability精品一、频率与概率frequency and probability 小概率原理小概率原理 若
3、事件若事件A发生的概率较小,如小于发生的概率较小,如小于0.05或或0.01,则认为,则认为事件事件A在一次试验中不太可能发生,这称为小概率事件实际在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的不可能性原理,简称小概率原理。这里的0.05或或0.01称为小称为小概率标准,农业试验研究中通常使用这两个小概率标准。概率标准,农业试验研究中通常使用这两个小概率标准。精品二、随机变量用以记录随机试验结果(outcome)的变量,称为随机变量(random variable),用大写英文字母X,Y 等代表。随机变量X的概率分布,表达 X 的可能取值和取这些值的概率规则
4、。精品离散型和连续型随机变量随机变量的可能取值是离散的数字,如计数型或分类型等,称为离散型随机变量(discrete random variable)。0,1,9。20次实验中成功的次数,二项式分布。随机变量的可能取值是某一实数的区间,如“大于0”或“-22之间”等,称为连续型随机变量(continuous random variable)。正态随机变量二、随机变量精品三、离散型随机变量的概率分布X=xix1,x2,xnP(X=xi)=pip1,p2,pn101iniipp 列出离散型随机变量X的所有可能取值 列出随机变量取这些值的概率 通常用下面的表格来表示 P(X=xi)=pi称为离散型随
5、机变量的概率函数精品四、连续型随机变量的概率密度若观察资料数量够大,则直方图(组数适当增加)的整体形态可用一近似的平滑曲线显示。直方图中纵轴改为次数比例,则该平滑曲线称为密度曲线(density curve)。精品概率密度曲线00.020.040.060.080.10.120.142345678910 11精品密度曲线的性质曲线都在水平线上(密度函数=0)。曲线下所涵盖的全部面积正好为1(所有可能性为1)。曲线下任何范围所涵盖的面积,为观察值落在该范围的比例(概率)。密度曲线可视为是观察变量的理论分布图形。四、连续型随机变量的概率密度精品随机变量X的一切可能取值的完备组中,各可能取值xi与其相
6、对应的概率pi乘积之和描述随机变量取值的集中程度计算公式为五、随机变量的数学期望精品随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)描述离散型随机变量取值的分散程度计算公式为六、随机变量的方差精品Section 3.2The Binomial Distributions二项分布精品一、二项分布设定The Binomial Setting固定的观察次数 n。n 次的观察都独立,每次的观察都不会对其他观察提供任何信息。每次的观察都只有两种可能的结果,多假设为“成功”或“失败”两种。每次的观察“成功”的概率都一样,设定为 p。精品二、二项分布Binomial Distributio
7、n满足二项分布设定的试验,以 X 记录 n次观察中“成功”的次数,则称 X 的分布为参数为 n 与 p 的二项分布(binomial),记为B(n,p)。X 的所有可能取值为0,1,n。对应的概率函数为 P(X=x)=P(x)。()(1)for x =0,1,&,n xxn xnP XxC pp精品 例例1 某种昆虫在某地区的死亡率为某种昆虫在某地区的死亡率为40%,即,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样现对这种害虫用一种新药进行治疗试验,每次抽样10头作头作为一组治疗。试问如新药无疗效,则在为一组治疗。试问如新药无疗效,则在10头中死头中死3头、头、2头、头、1头,以
8、及全部愈好的概率为多少?头,以及全部愈好的概率为多少?按上述二项分布概率函数式计算按上述二项分布概率函数式计算 7头愈好,头愈好,3头死去概率:头死去概率:8头愈好,头愈好,2头死去概率:头死去概率:9头愈好,头愈好,1头死去概率:头死去概率:10头全部愈好的概率:头全部愈好的概率:21499.0)60.0()40.0()3(73310 CP12093.0)60.0()40.0()2(82210 CP04031.0)60.0()40.0()1(91110 CP00605.0)60.0()40.0()0(100010 CP三、示例精品 若问若问10头中不超过头中不超过2头死去的概率为多少?则应该
9、头死去的概率为多少?则应该应用累积函数,即应用累积函数,即16729.012093.004031.000605.0)2()1()0()()2(20PPPyPF三、示例精品四、二项分布的期望值与标准差期望值:E(X)=np方差:Var(X)=np(1-p)标准差:)1(pnp精品Section 3.3Normal Distributions正态分布精品一、特点正态曲线所有正态曲线都有相同的外型具有对称、单峰及钟形的特性。正态曲线所代表的分布即为正态分布(normal distribution)每一正态分布都有其平均值 与标准差精品ms一、特点精品正态曲线较大ms一、特点精品正态曲线的拐点拐点落在
10、一个处拐点落在-处一、特点精品二、为什么这么重要Good descriptions for some distributions of real data身高,体重,考试成绩Good approximations to the results of many kinds of chance outcomesTossing a coin many timesMany statistical inference procedures are based on normal distributions精品三、68-95-99.7规则正态分布有其特定的数据分布规则:平均值为,标准差为 的正态分布68%
11、的观察资料落在m 的 1 之内95%的观察资料落在m 的 2 之内99.7%的观察资料落在m 的 3 之内精品0123-1-2-3mmsm2sm3smsm2sm3s68%的资料95%的资料99.7%的资料三、68-95-99.7规则精品四、变量标准化(Standardization)令观察值 x 服从平均值为,标准差为 的分布,则 x 的标准化值(standardized value)定义为标准化值又称为 z-值(z-score)。smxz精品标准化变量可以证明z的平均值为0z的标准差为1四、变量标准化(Standardization)smxz精品五、标准正态分布变量 X 服从平均值为 ,标准
展开阅读全文