第六章-频数分布列联表和假设检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第六章-频数分布列联表和假设检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 频数 分布 列联表 假设检验 课件
- 资源描述:
-
1、2020/4/8北京大学光华管理学院 胡健颖1市场调研市场调研Marketing Research主讲人:胡健颖教授北京大学光华管理学院2005年5月2020/4/8北京大学光华管理学院 胡健颖2市场调研第六章 频数分布:列联表和假设检验参考书第14章和第15章2020/4/8北京大学光华管理学院 胡健颖31.数据处理?确认与编辑 1)确认:目的是尽可能确保每份调查问卷都是有效问卷 2)编辑整理:确认是对访问员的欺骗行为及调查是否严守程序进行核实,而编辑是对访问员和应答者的错误进行检查。2020/4/8北京大学光华管理学院 胡健颖41.数据处理 下面情况的问卷一般是不能接受的:所回收的问卷是明
2、显不完整的,例如缺了一页或半页 问卷从整体上是回答不完整的 问卷的几个部分是回答不完整的 回答的模式说明调查员(或被访者)并没有理解或遵循访问(回答)指南,例如没有按要求跳答,等等 问卷是在事先规定的截止日期以后回收的 问卷是不合要求的被访者回答的 2020/4/8北京大学光华管理学院 胡健颖51.数据处理?数据编码?数据录入?数据清理 在录入数据后,利用计算机来检查数据的一致性,处理缺失值。?一致性检查:超出数据范围、逻辑问题、极端值?处理缺失值:中性值代替(如均值);估计值代替;删除 (去掉有缺失值的样本);结对删除(每一步计算中采用有完整 答案得样本)2020/4/8北京大学光华管理学院
3、 胡健颖62.数据的表现统计数字和统计图表?假如你已经获得了所要的全部数据;?认识数据的第一步:你得到的是什么类型的数据??利用图和表来展示数据中的信息;?运用指标刻画数据的某些特征和程度;?使用EXCEL来完成对数据的描述。2020/4/8北京大学光华管理学院 胡健颖7数据变量的分类数据变量的分类?按照取值类型:品质数据和数量数据;?按照测量水平:定类(Nominal)、定序(Ordinal)、定距(Interval)、定比(Ratio)等四类;?按照获取时间:截面数据、时间序列;?不同类型的数据应使用不同的统计方法;?问题:刚才的数据表中分别是什么类型?2020/4/8北京大学光华管理学院
4、 胡健颖8区分不同的测量水平区分不同的测量水平?区分原则:定类数据没有大小之分;定序数据有大小之分,差值有意义;定距数据有大小之分,差值有意义,但其比值无意义;定比数据比值有意义。?定比定距数据可以向前化成定序或者定类数据,但是将损失一定信息;反之,不能将定序定类数据化成定距定比数据。2020/4/8北京大学光华管理学院 胡健颖9品质标志的描述方法(1)频数分布、相对分布、百分比频数分布频数分布、相对分布、百分比频数分布是否锻炼 人数(频数)相对频数 百分比 累计百分比 非常喜欢 4 0.2 20.00%20.00%喜欢 6 0.3 30.00%50.00%一般 5 0.25 25.00%75
5、.00%不太喜欢 1 0.5 5.00%80.00%讨厌 2 0.1 10.00%90.00%很讨厌 2 0.1 10.00%100.00%求和 20 1 100.00%100%某校学生对体育锻炼的态度2020/4/8北京大学光华管理学院 胡健颖10品质标志描述方法(2)条形图、柱形图某校学生对体育锻炼态度调查结果0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%非常喜欢喜欢一般不太喜欢讨厌很讨厌2020/4/8北京大学光华管理学院 胡健颖11品质标志的描述方法(3)饼图某校学生对体育锻炼态度调查结果20%30%25%5%10%10%非常喜欢喜欢一般不
6、太喜欢讨厌很讨厌2020/4/8北京大学光华管理学院 胡健颖12对矿泉水市场的调查对矿泉水市场的调查北京市居民矿泉水最喜欢品牌33%32%19%5%4%3%2%2%乐百氏农夫山泉娃哈哈可赛雀巢蓝涧获特满其它2020/4/8北京大学光华管理学院 胡健颖13数量标志的描述方法(1)?频数分布1)单项式分布2)组距式分布:等组距、不等组距有关概念:组数、组限(上限、下限)、开口组、闭口组、组距、组中值2020/4/8北京大学光华管理学院 胡健颖14如何按品质标志分类如何按标志标志分类假设某年某月某工地100名工人所得工资资料如下:(单位:元)450 520 540 580 650 720 580 7
7、80 650 620首先:编制一个序列其次:编制变量数列数量标志的描述方法(1)案例:案例:2020/4/8北京大学光华管理学院 胡健颖15(1)单项变量数列表1 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)4204504808804234合计100数量标志的描述方法(数量标志的描述方法(1 1)2020/4/8北京大学光华管理学院 胡健颖16(2)等组距变量数列表2 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)4005001050060035600700207008002080090015合计
8、100数量标志的描述方法(数量标志的描述方法(1 1)2020/4/8北京大学光华管理学院 胡健颖17表3 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)500以下10500600356007002070080020800以上15合计100数量标志的描述方法(数量标志的描述方法(1 1)2020/4/8北京大学光华管理学院 胡健颖18注意几个问题:第一 工资水平是连续变量 要用重叠组限第二 组限的确定,即分组界限的确定第三 组距大小的确定第四 组数的确定,组数全距组距数量标志的描述方法(1)2020/4/8北京大学光华管理学院 胡健颖19(3)不
9、等组距变量数列如在生命统计中,人口死亡率将人口按年龄分组1岁以下11.9岁22.9岁33.9岁44.9岁组距为159.9岁1014.9岁1519.9岁组距为52029.9岁3039.9岁4049.9岁5059.9岁组距为106064.9岁组距为5数量标志的描述方法(1)2020/4/8北京大学光华管理学院 胡健颖20数量标志的描述方法(2)身 高频 数百 分 比 累计百分比=180210.00%100.00%累计20100.00%某校20名学生的身高分布表2020/4/8北京大学光华管理学院 胡健颖21数量标志的描述方法(3)直方图 X185.0180.0175.0170.0165.0160.
10、0155.0150.0Histogram Fitting Density CurvesNormal Curve(Mu=168.0 Sigma=9.94)65432102020/4/8北京大学光华管理学院 胡健颖22数量标志的描述方法(数量标志的描述方法(4 4)?对数据进行探索性分析:J.W.Tukey;?茎叶图(Stem-leaf)茎叶次数153,4,4315611601165,7,7,8,85170,2,3,44175,5,9,94180,12体重体重2020/4/8北京大学光华管理学院 胡健颖23描述两个变量的关系描述两个变量的关系?研究两个变量之间的关系:两个变量的类型分别是什么??两
11、个品质变量之间的关系;?一个品质变量和一个数量变量的关系;?两个数量变量之间的关系。2020/4/8北京大学光华管理学院 胡健颖24交叉分组列表(列联表)交叉分组列表(列联表)表1 学生性别对体育锻炼的态度调查结果比较非常喜欢 喜欢 一般 讨厌很讨厌 合计男80683651190女356250103160合计115130861543502020/4/8北京大学光华管理学院 胡健颖2545 岁以下45 岁或以上45 岁以下45 岁或以上是60%40%35%65%否40%60%65%35%调查对象人数300300200200是否希望出国旅行男性女性表2 年龄和性别对出国旅行的愿望的影响交叉分组列表
12、(列联表)交叉分组列表(列联表)2020/4/8北京大学光华管理学院 胡健颖26图形展示两个变量的关系图形展示两个变量的关系0.00000.05000.10000.15000.20000.2500非常喜欢喜欢一般讨厌很讨厌某校男女生对体育锻炼的态度男女2020/4/8北京大学光华管理学院 胡健颖27描述两个数量型的变量散点图学生身高和体重的散点图405060708090150160170180190学生身高(厘米)学生体重(千克)通过这个图,你觉得身高和体重是什么关系?2020/4/8北京大学光华管理学院 胡健颖28数据描述的数值方法数据描述的数值方法?通过数据指标来概括数据中的信息;?如何刻
13、画数据的集中程度,或集中位置;?如何刻画数据的变异程度;?如何刻画检验异常值;?如何刻画两个变量之间的关系;?探索性分析。2020/4/8北京大学光华管理学院 胡健颖29数据集中位置的度量数据集中位置的度量?平均数(Mean)?中位数(Median)?众数(Mode)?四分位数(Quartiles)?百分位数(Percentiles)?调整(或截尾)平均数(Trimmed Mean)2020/4/8北京大学光华管理学院 胡健颖30一个例子一个例子某城市一居室月租金(美元)的 70个数据4254304304354354354354354404404404404404454454454454454
14、504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152020/4/8北京大学光华管理学院 胡健颖31平均月租金平均月租金美元80.49070356,34?nxxi2020/4/8北京大学光华管理学院 胡健颖32月租金的中位数月租金的中位数中位数=(475+475)/2=475美元4254304304354354354354354404404
15、404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152020/4/8北京大学光华管理学院 胡健颖33月租金的众数月租金的众数众数是450,450出现的最多,频数是 74254304304354354354354354404404404404404454454454454454504504504
展开阅读全文