计量资料的统计推断课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《计量资料的统计推断课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 统计 推断 课件
- 资源描述:
-
1、计量资料的统计推断内容第一节第一节 标准误标准误第二节第二节 t 分布分布第三节第三节 总体均数的估计总体均数的估计第四节第四节 假设检验假设检验第五节第五节 未知总体与已知总体均数的比较未知总体与已知总体均数的比较第六节第六节 完全随机设计两总体均数的比较完全随机设计两总体均数的比较第一节第一节 标准误(标准误(Standard error)一、概念一、概念抽样误差:抽样误差:由于抽样引起的样本由于抽样引起的样本统计量统计量与总体与总体参数参数之之间的差异。间的差异。标准误标准误 :( x Sx) 表示抽样误差大小的指标;表示抽样误差大小的指标; 样本均样本均数的标准差。数的标准差。SPSS
2、结果中用结果中用std. error of mean 表示表示 3X 1S1X 2 S2 X ISiX nSnxX服从什么分布?567三、三、 (均数)标准误(均数)标准误意义:意义:反映抽样误差的大小。标准误越反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总小,抽样误差越小,用样本均数估计总体均数的可靠性越大。体均数的可靠性越大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准,标准误误二、(均数)标准误的计算二、(均数)标准误的计算nssxAnalyze-Descriptive Statistics-Frequencies-Statistics-Dispersion-
3、S.E. mean-Continue-OK8SPSS计算标准误9哥塞特(W.S. Gosset,18761937)1908年,哥塞特首次以“学生”(Student)为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。 戈塞特:t分布与小样本 由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性” 10小样本思想小样本思想1112t 分布的图形(分布的图形(u 分布分布 是是t 分布分布的特殊形式)的特殊形式)13t 值表值表(附表(附表2 ) 左侧列:
4、自由度,左侧列:自由度, 上两行:概率,上两行:概率, p, 即曲线下阴影部分的面积即曲线下阴影部分的面积; 表中的数字:相应的表中的数字:相应的 |t | 界值。界值。t 值表规律:值表规律:(1) 自由度(自由度()一定时,)一定时,p 与与 t 成反比成反比;(2) 概率(概率(p) 一定时,一定时, 与与 t 成反比成反比; t分布类似于标准正态分布。 标准正态曲线的方差为1,而在小样本时可以证明t是大于1的,而当n无限大时,t趋向于1。 对于小的n值,t分布比标准正态分布要分散些,t依赖于两个随机变量: 当n无限增大时t的变异减少,事实上存在着整个一族的t分布。每一个样本容量n对应该
5、分布族的一个成员。 当n增大时,t分布就接近于正态分布,当n增至30以上时,t分布和正态分布几乎没有什么区别。15nsx和第三节第三节 总体均数的估计总体均数的估计统计推断的任务就是用样本信息推论总体特征。统计推断的任务就是用样本信息推论总体特征。参数估计,参数估计,用样本均数估计总体均数。用样本均数估计总体均数。 1、 点(值)估计(近似值)点(值)估计(近似值)2、 区间估计(近似范围)区间估计(近似范围)16171、点点(值值)估计(估计(point estimation):用样本均数直接作为总体均数的估计值,用样本均数直接作为总体均数的估计值, 未考虑抽样未考虑抽样误差。误差。 概念概
6、念:根据样本均数,按一定的根据样本均数,按一定的可信度可信度计算计算 出出总体均数很可能在的一个总体均数很可能在的一个数值范围数值范围,这个范,这个范围称为总体均数的围称为总体均数的可信区间可信区间(confidence interval, CI)。谁的区间?。谁的区间? 方法方法(但是在(但是在SPSS下程序相同)下程序相同)(1) u 分布分布 法法(2) t 分布法分布法182、区间估计、区间估计(interval estimation)19(1)u 分布分布 法法公式公式应用条件应用条件:例题例题意义:与正常值范围进行比较意义:与正常值范围进行比较(xus x,xu s x) 即(xu
7、s x)样本量较大, 已知或可计算出 x 及 Sx Analyze-Descriptive Statistics-Explore-身高Statistics-Descriptives-Continue-OK20SPSS求可信区间21DescriptivesDescriptives163.7430.37998162.9890164.4970163.7522163.650014.4393.79985154.70173.6018.905.05-.030.241-.250.478MeanLower BoundUpper Bound95% ConfidenceInterval for Mean5% Tri
8、mmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis身高Statistic Std. Error可信区间22StatisticsStatistics身高1000163.7430.379983.79985155.9675170.8850ValidMissingNMeanStd. Error of MeanStd. Deviation2.597.5Percentiles正常值范围 换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0 -
9、 164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错的,说错的概率是概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是的结论,说对的概率是99%,说错的概率是,说错的概率是1%。(可信区间)意义:(可信区间)意义:虽然不能知道某校全体女大学生身高均数的虽然不能知道某校全体女大学生身高均数的确切数值,全体女大学生身高均数在确切数值,全体女大学生身高均数在163.0 - 164.5cm之间的可能性是之间的可能性是95%,在,在 162.7 164.7cm之之间的可能性是间的可能性是99%。24(2)t 分布分布 法法
10、公式公式(x ts x,xt s x) 即(xts x)25区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小, 用用 (1- ) 来衡量。来衡量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n, S 一定时)一定时) 。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范围越指区间范围的宽窄,范围越宽精确度越差。宽精确度越差。99%的可信区间的可信区间差于差于95%的可信区间的可信区间(n, S 一定时)一定时) 。 准确度与精确度的关系:准确度与精确度的关系:(例如预测孩子的身高)(例如预测孩子的身高)26正常值范围正常值范围概念:概念:绝大多数正
11、常人的某指绝大多数正常人的某指标范围。(标范围。(95%,99%, 指绝指绝大多数正常人)大多数正常人)计算公式:计算公式:SPSS程序:百分位数法程序:百分位数法用途:判断观察对象的某用途:判断观察对象的某项指标是否正常项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所在的数值范围(范围( 95%,99% 指可信度)指可信度)计算公式:计算公式:SPSS程序:程序:用途:估计总体均数用途:估计总体均数正常值范围估计与可信区间估计正常值范围估计与可信区间估计第四节第四节 假设检验假设检验也叫也叫显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了
12、:某事发生了: 是由于碰巧?还是由于必然是由于碰巧?还是由于必然的原因?统计学家运用显著的原因?统计学家运用显著性检验来处理这类问题。性检验来处理这类问题。27假设检验:假设检验:1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果 从两个总体中进行随机抽样,得到两个样本均数从两个总体中进行随机抽样,得到两个样本均数X1、X2。 X1、X2不同不同。不同的原因是什么?。不同的原因是什么? X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性成
13、了样本均数的差别。差别无显著性 。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。以两种改善骨质疏松的药为例以两种改善骨质疏松的药为例291、假设检验的原因、假设检验的原因2、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做出决策。反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A和和B,为,为了肯定其中的一种情况了肯定其中的一种情况A,但又不能直接证实,但又不能直接证实A,这,这时否定另一种可能时否定另一种可能B,则间接的肯定了,则间接的肯定了A。概率论(小概率):如果一件事情发生的概率很小,概率论(小概率):
14、如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是那么在进行一次试验时,我们说这个事件是“不会发不会发生的生的”。从一般的常识可知,这句话在大多数情况下。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的小也是有可能发生的。 建立假设:建立假设: 确定显著性水平(确定显著性水平( ):): 计算统计量:计算统计量:u, t, 2 确定概率值:确定概率值: 做出推论做出推论324、假设检验的一般步骤、假设检验的一般步骤 为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取
15、随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。33 1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2 15.00
展开阅读全文