第十三讲量的资料统计与分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十三讲量的资料统计与分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 三讲 资料 统计 分析 课件
- 资源描述:
-
1、1第十三讲 量的资料统计与分析吕国光西北师范大学教育科学学院2 统计学家视数据为资源,并且试图从数据中看出平常人所看不到的景致来。3内容复习内容复习z统计学的定义、分类;z认识数据的第一步:你得到的是什么类型的数据?z利用图表展示数据中的信息;z运用指标刻画数据的某些特征和程度;z使用EXCEL和SPSS来描述数据;4抽样分布和估计抽样分布和估计5统计推断的基本概念统计推断的基本概念z总体:有限总体、无限总体;z样本;z统计推断的任务:通过样本的统计量来了解总体的参数。z为什么需要抽样:1)总体无法得到;2)时间成本不允许;3)实验具有破坏性。6统计推断的基本思想统计推断的基本思想z1)选用一
2、个概率模型概率模型来刻画总体,使用样本对模型做出推断;z2)样本的获取的可能性可能性依赖于你选用的模型;根据这种可能性来分析我们由部分来认识总体所可能犯的错误(风险)。7统计推断的内容之一统计推断的内容之一z估计参数z点估计和区间估计z点估计的例子 居民家庭年收入 ),(2N22121)(111xxnsxnxniinii8统计推断内容之二统计推断内容之二z 假设检验:是否可以选用这个模型?z例子:是否可以使用模型N(570,306)来刻画所有居民的家庭年收入?z思想:如果该模型是好的,那么 和570相差很多的可能性不能太大。x9简单随机抽样z有限总体的简单随机抽样:等概率抽样;有放回抽样:独立
3、性 无放回抽样:非独立性抽样方法:利用随即数表 利用 Excel 10随机数表的使用77191 25860 55204 73417 83920 6948676298 26678 89334 33938 95567 2938057099 10528 09925 89773 41335 9624415987 46962 67342 77592 57651 9550853122 16025 84299 53310 67380 8424937203 64516 51530 37069 40216 6137411 z无限总体的简单随机抽样:独立性;z例子:掷硬币12样本和总体分布z例子:薯片z一个箱子中
4、有10000包薯片,其中50%标价5元,30%标价10元,10%标价15元,10%标价30元。13点估计的方法点估计的方法z估计量(统计量);估计值。z基于一定的准则求最好的估计量。极大似然法则;矩估计;最小二乘估计等14抽样分布z样本不同,值也不同。那么 取不同值的可能性分别是什么?z 的概率分布称作它的抽样分布。z抽样分布在统计推断中的中心地位。z抽样分布取决于总体的分布(模型)以及抽样的方式。抽样方式 总体分布=抽样分布xxx15 样本均值的抽样分布(无限总体)z如果总体服从 ,那么简单随机样本的均值服从正态分布z如果样本容量n非常大,而且总体的期望是,方差是2+,那么简单随机样本的均值
5、 近似服从正态分布 (中心极限定理)),(2N)n ,(2Nx)n ,(2N16样本比率的抽样分布 (无限总体)z小样本情况 x服从二项式分布B(n,p).z大样本情况,按照中心极限定理,近似地 nxp)np)-p(1 ,(pNp17正态分布的图形正态分布的图形正态分布的密度曲线正态分布的密度曲线-0.100.10.20.30.40.50.6-6-4-20246f(x)sigma=0.5f(x)sigma=218有限总体的修正系数z设N是总体中个体的个数,n是样本容量,那么样本均值的方差是:样本比率的方差是:注:如果N相比n大很多,比如n/N5%,可以视为无限总体。nNnNx221nppNnN
6、p)1(1219样本方差的抽样分布样本方差的抽样分布z如果 是来自正态总体 的一个随机样本,定义样本方差为:nxxx,21),(2N)1()1()(11222212nsnxxnsnii则20认识卡方分布认识卡方分布卡方分布的密度函数卡方分布的密度函数-0.0500.050.10.150.20.250.30.350.40.450.5051015202530Chisq(1)Chisq(4)Chisq(10)21方差未知时样本均值的抽样分布方差未知时样本均值的抽样分布z正态总体,2未知,使用样本方差s2来替代2,则样本均值满足:zn30时,可以用标准正态分布近似。)1()(ntsxn22正态分布和正
7、态分布和t t 分布的比较分布的比较正态分布与t 分布比较正态分布与t 分布比较00.10.20.30.40.5-4-3-2-101234normalnormalt(1)t(1)t(3)t(3)t(5)t(5)t(9)t(9)t(19)t(19)23估计的误差z不能以个别估计值作为评价准则;z估计的误差:偏差估计量的方差 )()()()(222xExVarxExExExE24对估计量的评价对估计量的评价z无偏性:偏差是零;z有效性:方差最小;z一致性:样本容量增加会降低估计误差。z样本均值(比率)是对总体均值(比率)的一个无偏的、有效的、一致的估计量。25 将概率模型引入统计推断中来刻画总体,
8、可以使得我们能够测量和控制由部分(样本)来推断总体时所犯的错误。26Estimate PopulationParameter.with SampleStatisticMean ProportionpVariances2Population Parameters Estimated 2Difference -12 x -x 12_px27 z 的抽样分布:1)正态总体 时,x),(2N).1(1);,0(;),(2ntxNxNxnsnn未知,如果已知,如果28 2)非正态总体时,大样本情况(n30)1).,0(1);,0();,(n2NxNxNxnsn近似地未知,如果近似地已知,如果近似地,29
9、 zS2的抽样分布:当总体是正态分布时,)1()1(222nsn30 z 的抽样分布:p1),0()1().)1(,(,5)1(5 NnppppnpppNppnnp可以近似地有经常地,可以近似地认为)条件下且在大样本(满足31 z有限总体时样本均值和样本比率的标准误差,有限总体修正系数。.)1(1;1 nppNnNnNnNpx32联合食品公司的案例联合食品公司的案例z针对“联合食品公司”的案例(P.44 案例2-1),我们假设调查的100个客户组成一个简单随机样本。尝试回答下面的问题:1)所有客户一次购买金额的平均值是多少?2)所有使用信用卡的客户一次购买金额的平均值是多少?3)使用信用卡的客
10、户占的比例是多少?33al l dat a平均29.4449标准误差2.04162中值27.63模式#N/A标准偏差20.4162样本方差416.8213峰值-1.05328偏斜度0.31424区域77.07最小值1.09最大值78.16求和2944.49计数10034C r edi t平均40.8768182标准误差3.17110824中值45.33模式#N/A标准偏差14.873816样本方差221.230404峰值-1.00003171偏斜度-0.11736036区域55.33最小值14.44最大值69.77求和899.29计数2235 1)所有客户一次购买金额的平均值是多少?(29.4
11、449)2)所有使用信用卡的客户一次购买金额的平均值是多少?(40.8768)3)使用信用卡的客户占的比例是多少?(0.22)36我们的估计值离真值有多远?我们的估计值离真值有多远?z我们希望通过样本的信息给出一个范围,使这个范围按足够大的概率包含我们所感兴趣的参数。z如何寻找K和L,使得以95%的概率成立:.;LppLpLppKxKxKx或者或者37 z抽样误差:无偏点估计值与总体参数之差的绝对值。38样本均值的抽样分布样本均值的抽样分布00.050.10.150.20.250.30.350.40.45-4-3-2-10123495%的概率z-z1-39大样本且大样本且 已知的情况已知的情况
展开阅读全文