第10章数理统计及应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第10章数理统计及应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 10 数理统计 应用 课件
- 资源描述:
-
1、 许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具。第第1010章章 数理统计及应用数理统计及应用第第1010章章 数理统计及应用数理统计及应用n本章内容:本章内容:通过实例,介绍如何使用Excel 2007统计函数和数据分析工具进行数据统计分析与预测。包括描述性统计、假设检验、方差分析和回归分析等n教学目标:教学目标:掌握利用Excel函数和数据分析工具进行统计分析与预测的基本方法n 数理统计的基本概念n 描述性统计n 假设检验n 方差分析n 回归分析第第1010章章 数理统计及应用数理统计及应用 数理统
2、计是一门对客观不确定现象进行数据搜集、整理和分析的科学其目的是了解客观情况,探索数据内在结构及现象之间的规律性 Excel 2007 能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括函数和数据分析工具。主要支持以下各方面的内容:第第1 1节节 数理统计的基本概念数理统计的基本概念第第1 1节节 数理统计的基本概念数理统计的基本概念按功能划分统计函数的种类包括按功能划分统计函数的种类包括:(1)频数分布处理(2)描述统计量计算(3)概率计算(4)参数估计(5)假设检验(6)卡方检验(7)相关、回归分析第第1 1节节 数理统计的基本概念数理统计的基本概念按功能划分统计函数的种
3、类包括:(1)频数分布处理(2)描述统计量计算(3)概率计算(4)参数估计(5)假设检验(6)卡方检验(7)相关、回归分析第第1 1节节 数理统计的基本概念数理统计的基本概念数据分析工具的种类:数据分析工具的种类:(1)统计绘图、制表(2)描述统计量计算(3)参数估计(4)假设检验(5)方差分析(6)相关、回归分析(7)时间序列分析(8)抽样(9)数据变换第第1 1节节 数理统计的基本概念数理统计的基本概念使用数据分析工具,需加载:使用数据分析工具,需加载:单击“Office按钮”,然后单击“Excel选项”单击“加载项”,然后在“管理”框中,选择“Excel 加载宏”单击“转到”在“可用加载
4、宏”框中,选中“分析工具库”复选框,然后单击“确定”确定后“数据”选项卡中增加了“数据分析”子项 在进行数据分析的时候,一般首先要对数据进行描述性统计描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述描述性统计性统计分析要对调查总体所有变量的有关数据做统统计性描述计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计统计图形。第第2 2节节 描述性统计描述性统计数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等 作用:作用:指出一数据资料内变量的中心位置,标志着
5、资料所代表性状的数量水平和质量水平;作为样本或资料的代表数与其它资料进行比较2.1 2.1 数据集中趋势分析数据集中趋势分析n平均数 算术平均数(average)调和平均数(harmean)几何平均数(geomean)2.1 2.1 数据集中趋势分析数据集中趋势分析几何平均可用于平均比率的计算,这里变化比率是在相等长度的时间区间内给出的。如果样本观测值包含某种倒数,则可用调和平均,特别地,调和平均可用于以不同的速度通过各路段,求总的平均速度;或在各种条件下,求不同密度的流体的平均密度的计算。调和平均数调和平均数 某人从C到B的平均速度为30km/h,沿同一路线返回时平均速度为60km/h,求整
6、个往返行程的平均速度为多少?用Excel调和平均数求解:“=HARMEAN(30,60)”40 即40km/h。2.1 2.1 数据集中趋势分析数据集中趋势分析 几何平均数几何平均数 一雇员在连续三年内的年薪增长率分别为6%、10%和12%,这里增加的百分数是在上一年的薪金基础上计算的,求其三年内的年薪平均增长率?用Excel几何平均数求解:“=GEOMEAN(1.06,1.1,1.12)”1.0930 所以,薪水的年平均增长率为9.3%。2.1 2.1 数据集中趋势分析数据集中趋势分析n中位数(MEDIAN)2.1 数据集中趋势分析数据集中趋势分析 中位数是样本的50分位点,它受极端数值的干
7、扰很小。如果加入一个很大的干扰值,中值数仅可能有很小的移动。几何均值和调和均值同算术平均值一样,对极端数值也较敏感。它们主要用于数据为对数正态分布或偏斜程度较大时。下例显示上述几种统计量对极端数值的敏感程度 A1:A7=1 1 1 1 1 1 100 =geomean(A1:A7)1.9307 =harmean(A1:A7)1.1647 =average(A1:A7)15.1429 =median(A1:A7)1 2.1 数据集中趋势分析数据集中趋势分析几何均值调和均值算术平均值中位数中位数 数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有极差、方差、标准差、四分位数间距等 作
8、用:作用:描述变量分布的差异程度 衡量和比较均值指标的代表性高低 为抽选样本单位数提供依据2.2 数据离散程度分析数据离散程度分析 极差为样本最大与最小值之差,是描述数据分散程度最简单的度量,但如果数据中出现了极端数据,极端数据有可能就是最大值或最小值,因此极差对极端数据非常敏感。标准差和方差是常用的分散程度度量。方差是各个数据与其算术平均数的离差平方和的平均数。方差的计量单位和量纲不便于从实际意义上进行解释,所以实际统计中多用方差的算术平方根标准差来测度统计数据的差异程度。它们对于正态分布的样本是最优的。但它们对极端数据也是较敏感的。偏离数据整体的一个极端数据可能会使它们的值急剧增大。2.2
9、 数据离散程度分析数据离散程度分析 四分位间距是样本数据上四分位数与下四分位数之差。因为只有50的数据影响其度量值,故其对极端数据抗干扰能力较强。2.2 数据离散程度分析数据离散程度分析 下例显示上述几种统计量对极端数值的敏感程度 A1:A7=1 1 1 1 1 1 100 =max(A1:A7)-min(A1:A7)99 =stdev(A1:A7)37.4185 =QUARTILE(A1:A7,1)17.2 7.2 描述性统计描述性统计极差极差标准差标准差四分位间距四分位间距2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计
10、数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 若让你就评价两人的检验技术的好坏,你如何评价?2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 两人计数的均数都是500,能说两人的检验技术相同吗?不能,因为甲的计
11、数结果比较密集,而乙的分散,因此甲的检验精度显然比乙的高。可以用极差来衡量:甲计数的极差为520480=40,乙的为560-440=120。可见乙的计数较甲的波动大。2.2 数据离散程度分析数据离散程度分析 设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为:甲甲 480 490 500 510 520480 490 500 510 520 乙乙 440 460 500 540 560440 460 500 540 560 甲乙甲乙480440490460平均500平均500500500标准误差7.071标准误差22.8510540中位数500中位数50
12、0520560标准差15.81标准差50.99方差250方差2600第第3 3节节 假设检验假设检验 假设检验是统计推断的基本问题之一,主要是确定关于样本总体特征的判断是否合理的过程。先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。n假设检验的基本思想和原理假设检验的基本思想和原理 n假设检验的步骤假设检验的步骤n总体均值的检验总体均值的检验假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择!首先对几个必要的名词作简要的解释:零假设零假设:即初始判断 H0:=0 (=50)备选假设备选假设(也称对立假设)
13、:H1:0(或(或0 或或50 或或,拒绝,拒绝H0的样本证据不足,就不拒绝的样本证据不足,就不拒绝H0,暂且认为,暂且认为H0成立成立 根据统计推断结果,结合相应的专业知识,给出根据统计推断结果,结合相应的专业知识,给出一个专业的结论。一个专业的结论。第第3节节 假设检验假设检验 1 1 假设检验的步骤:假设检验的步骤:(1)提出统计假设,零假设H0和备选假设H1 (2)规定显著水平 (3)选取样本统计量 (4)在显著水平下,算出统计量服从分布的临界值,确定假设参数的拒绝域第第3节节 假设检验假设检验 2 2 参数的假设检验:参数的假设检验:n 单个样本的假设检验单个样本的假设检验 第第3节
14、节 假设检验假设检验 对单个样本的假设检验,我们可以根据抽样推断的思路,用相应函数计算临界值,来判断是接受还是拒绝零假设。以检验均值为例,当样本是小样本(即n 30)时,我们使用t 统计量;当样本是大样本时,我们使用z统计量。第第3节节 假设检验假设检验举例:举例:某工人包装果脯,假定果脯的重量服从正态分布。检验员随机抽查12 包,计算出样本平均数为159 克,样本标准差为1.5 克,果脯的包装要求是平均重量=160 克。若显著性水平为0.1,该工人包装的果脯是否合格?解:H0:=160计算t统计量:H1:16031.211/5.1160159/xtns显著性水平为0.1,自由度为11,所以输
15、入“=TINV(0.1,11)”可得ta=1.796,即为临界值。第第3节节 假设检验假设检验举例:举例:某工人包装果脯,假定果脯的重量服从正态分布。检验员随机抽查12 包,计算出样本平均数为159 克,样本标准差为1.5 克,果脯的包装要求是平均重量=160 克。若显著性水平为0.1,该工人包装的果脯是否合格?解:H0:160计算t统计量:H1:16031.211/5.1160159/xtns特别注意特别注意:假设检验是分单边和双边的。上例的问题是“该工人包装的干果是否偏少?”,那么这就是单边检验,在计算临界值是则为“=TINV(0.2,11)”,ta=1.363第第3节节 假设检验假设检验
16、举例:举例:某工人包装果脯,假定果脯的重量服从正态分布。检验员随机抽查50 包,计算出样本平均数为159 克,样本标准差为1.5 克,果脯的包装要求是平均重量=160 克。若显著性水平为0.05,该工人包装的果脯是否合格?解:H0:=160计算t统计量:H1:1601.7450/5.1160159/xzns输入“=NORMSINV(0.025)”,可得za=-1.96,即为临界值。z 的值小于临界值za 落入拒绝区,H0 被否定,即该工人包装的果脯不合格。2 2 参数的假设检验:参数的假设检验:n 成对观测值的假设检验成对观测值的假设检验 第第3节节 假设检验假设检验 均值假设检验:均值假设检
17、验:t 检验检验(平均值的成对二样本分析 双样本等方差、双样本异方差)Z 检验检验 方差检验:方差检验:F检验检验 第第3节节 假设检验假设检验 t 检验检验(平均值的成对二样本分析)用以对两组成对数据进行均值是否相等的检验。实际工作中往往会遇到均值的成对比较,如采用新教育方法前后学生的成绩、进行体育疗法前后患者的血压等。当样本中的观察值存在配对关系时,可以使用“成对双样本t-检验”。第第3节节 假设检验假设检验 t 检验检验(平均值的成对二样本分析)nH0:D 0(D=1-2)H1:D 0n规定显著水平:规定显著水平:n检验统计量检验统计量:t 统计量服从t分布举例:举例:第第3节节 假设检
18、验假设检验您在人力资源部工作,您想了解一个培训项目是否有效.您收集到以下考试成绩的数据:姓名姓名前前(1)后后(2)Sam8594Tamika9487Brian7879Mike8788在 0.10 水平,这个培训有效吗?举例:举例:第第3节节 假设检验假设检验t-t-检验检验:成对双样本均值分析成对双样本均值分析前前 (1)(1)后后 (2)(2)平均平均86868787方差方差43.333333343.33333333838观测值观测值4 44 4泊松相关系数泊松相关系数0.476435260.47643526假设平均差假设平均差0 0dfdf3 3t Statt Stat-0.306186
19、2-0.3061862P(T=t)P(T=t)单尾单尾0.3897410.389741t t 单尾临界单尾临界1.637744351.63774435P(T=t)P(T=t)双尾双尾0.7794820.779482t t 双尾临界双尾临界2.353363432.35336343 第第3节节 假设检验假设检验 t 检验检验(双样本等方差平均值的检验)nH0:1-2=0 (1=2)H1:1-2 0 (1 2)n规定显著水平:规定显著水平:n检验统计量检验统计量:t 统计量服从t分布假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0 1 1 =2 2 1 1 2 2 1 1 2 2H1 1
展开阅读全文