第二章统计数据的描述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第二章统计数据的描述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 统计数据 描述 课件
- 资源描述:
-
1、华南理工大学精品课程华南理工大学精品课程统计学统计学统计数据的描述统计数据的描述第二章第二章华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述录取中有无歧视录取中有无歧视?某高校只有两个系,财经系和工程系。某高校只有两个系,财经系和工程系。该校报考及录取的总体情况如下:该校报考及录取的总体情况如下:男生男生女生女生录取录取350350200200未录取未录取450450400400报考人数报考人数800800600600引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述 如果我们只看该校男女生录取的如果我们只看该校男女
2、生录取的比率,即男生比率,即男生350/800=44%,350/800=44%,女生女生200/200/600=33%600=33%。这时我们不免会问,是男同。这时我们不免会问,是男同学的成绩比女同学好,还是在录取中学的成绩比女同学好,还是在录取中存在着性别的歧视?学过统计学的同存在着性别的歧视?学过统计学的同学不会简单地做出结论,而是继续搜学不会简单地做出结论,而是继续搜集数据并得到两个系各自录取的男女集数据并得到两个系各自录取的男女生数据:生数据:引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述工程系工程系财经系财经系男生男生女生女生 男生男生
3、女生女生录取录取3003001001005050100100未录取未录取300300100100150150300300报考人数报考人数 600600200200200200400400引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述 有了分系的录取数据,不难看到工程有了分系的录取数据,不难看到工程系录取的人数比较多,男女生录取的比系录取的人数比较多,男女生录取的比率都是率都是50%50%。而财经系招生名额较少,而财经系招生名额较少,男女生录取的比率都是男女生录取的比率都是25%25%。由于女生。由于女生报财经系的人多,男生报工科的人多,报财经系的
4、人多,男生报工科的人多,因而导致男生整个录取率偏高,而女生因而导致男生整个录取率偏高,而女生偏低。这个例子告诉我们对数据一是要偏低。这个例子告诉我们对数据一是要从不同角度进行分析,二是要注意权数从不同角度进行分析,二是要注意权数的影响,这就是本章要讨论的问题。的影响,这就是本章要讨论的问题。引例:引例:华南理工大学精品课程华南理工大学精品课程6 6引例提问引例提问录取中有无歧视?录取中有无歧视?Q1Q2Q3统计学怎样对数据进行有效分析?统计学怎样对数据进行有效分析?怎样理解权数对均值的影响?怎样理解权数对均值的影响?华南理工大学精品课程华南理工大学精品课程7 7本章学习内容本章学习内容p1.1
5、.学习如何用数据对客观事物进行计量,学习如何用数据对客观事物进行计量,如何获取数据以及对数据质量的评价如何获取数据以及对数据质量的评价p2.2.如何对获取的数据进行整理如何对获取的数据进行整理p3.3.数据分布的集中趋势和离散程度数据分布的集中趋势和离散程度p4.4.非正态总体的分布偏态和峰度非正态总体的分布偏态和峰度p5.5.茎叶图和箱线图的特点和优势茎叶图和箱线图的特点和优势p6.6.统计表及统计图统计表及统计图华南理工大学精品课程华南理工大学精品课程8 8本章学习目标本章学习目标p 了解数据的计量尺度了解数据的计量尺度p 了解统计数据的来源和数据的质量要求了解统计数据的来源和数据的质量要
6、求p 掌握数值型数据的整理方法掌握数值型数据的整理方法p 掌握数据集中趋势和离散程度的测度方法掌握数据集中趋势和离散程度的测度方法p 掌握茎叶图和箱线图的制作方法掌握茎叶图和箱线图的制作方法p 掌握分布偏态与峰度的测度方法掌握分布偏态与峰度的测度方法p 掌握统计表和统计图的使用掌握统计表和统计图的使用华南理工大学精品课程华南理工大学精品课程9 9第一节第一节 数据的计量尺度数据的计量尺度2.12.22.32.42.5第二章具体章节结构第二章具体章节结构 第二节第二节 统计数据的来源统计数据的来源第三节第三节 统计数据的质量统计数据的质量第四节第四节 统计数据的整理统计数据的整理第五节第五节 分
7、布集中趋势的测度分布集中趋势的测度华南理工大学精品课程华南理工大学精品课程1010第六节第六节 分布离散程度的测度分布离散程度的测度2.62.72.82.9第七节第七节 分布偏态与峰度的测度分布偏态与峰度的测度第八节第八节 茎叶图与箱线图茎叶图与箱线图第九节第九节 统计表与统计图统计表与统计图第二章具体章节结构第二章具体章节结构 华南理工大学精品课程华南理工大学精品课程第一节第一节 数据的计量尺度数据的计量尺度 按照计量学的一般分类方法,对数按照计量学的一般分类方法,对数据分为四种计量尺度,即:据分为四种计量尺度,即:一、列名尺度一、列名尺度二、顺序尺度二、顺序尺度三、间隔尺度三、间隔尺度四、
8、比率尺度四、比率尺度华南理工大学精品课程华南理工大学精品课程1212列名尺度列名尺度 (Nominal scaleNominal scale)1.1.也称名义尺度或分类尺度也称名义尺度或分类尺度2.2.计量层次最低计量层次最低3.3.对事物进行平行的分类对事物进行平行的分类4.4.各类别可以指定数字代码表示各类别可以指定数字代码表示5.5.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求6.6.数据表现为数据表现为“类别类别”7.7.具有具有=或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1313顺序尺度顺序尺度 (Ordinal scaleOrdina
9、l scale)1.1.也称定序尺度也称定序尺度2.2.对事物分类的同时给出各类别的顺序对事物分类的同时给出各类别的顺序3.3.比定类尺度精确比定类尺度精确4.4.未测量出类别之间的准确差值未测量出类别之间的准确差值5.5.数据表现为数据表现为“类别类别”,但有序,但有序6.6.具有具有 或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1414间隔尺度间隔尺度 (Interval scaleInterval scale)1.1.也称间隔尺度也称间隔尺度2.2.对事物的准确测度对事物的准确测度3.3.比定序尺度精确比定序尺度精确4.4.数据表现为数据表现为“数值数值”5.5.没
10、有绝对零点没有绝对零点6.6.具有具有 +或或 -的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1515比率尺度比率尺度 (Ratio scaleRatio scale)1.1.也称比率尺度也称比率尺度2.2.对事物的准确测度对事物的准确测度3.3.与定距尺度处于同一层次与定距尺度处于同一层次4.4.数据表现为数据表现为“数值数值”5.5.有绝对零点有绝对零点6.6.具有具有 或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1616四种计量尺度的比较四种计量尺度的比较定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度 定比尺度定比尺度 分类分类(=(=,)排序排序
11、()间距间距(+(+,-)-)比值比值(,)“”表表2-1 2-1 四种计量尺度的比较四种计量尺度的比较华南理工大学精品课程华南理工大学精品课程1717本节提问本节提问数据的计量尺度分为哪几种?数据的计量尺度分为哪几种?Q1Q2Q3不同计量尺度各有什么特点?不同计量尺度各有什么特点?间隔尺度和比例尺度有何区别?间隔尺度和比例尺度有何区别?华南理工大学精品课程华南理工大学精品课程第二节第二节 统计统计数据的来源数据的来源 统计数据来源于直接组织的调统计数据来源于直接组织的调查、观察和科学试验,我们称之为第查、观察和科学试验,我们称之为第一手数据或直接的数据一手数据或直接的数据;或者来源于或者来源
12、于已有的数据,我们称之为第二手数据已有的数据,我们称之为第二手数据或间接的数据。或间接的数据。一、间接获取的数据一、间接获取的数据 二、直接获取的数据二、直接获取的数据华南理工大学精品课程华南理工大学精品课程1919间接取得的数据间接取得的数据1.1.统计部门和政府部门公布的有关资料,如各类统计部门和政府部门公布的有关资料,如各类统计年鉴统计年鉴2.2.各类经济信息中心、信息咨询机构、专业调查各类经济信息中心、信息咨询机构、专业调查机构等提供的数据机构等提供的数据3.3.各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料4.4.各种会议,如博览会、展销会、交易会及专业各种
13、会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料性、学术性研讨会上交流的有关资料5.5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料中国统计出版社华南理工大学精品课程华南理工大学精品课程2020提供统计数据的部分政府网站提供统计数据的部分政府网站中国政府及相关机构中国政府及相关机构 网址网址数据内容数据内容国家统计局国家统计局http:/http:/统计年鉴、统计统计年鉴、统计月报等月报等国务院发展研究中心国务院发展研究中心信息网信息网http:/.chttp:/ n宏观经济、财经、宏观经济、财经、货币金融等货币金融等 中国经济信息网中国经济信息网htt
14、p:/http:/经济信息及各类经济信息及各类网站网站华通数据中心华通数据中心http:/http:/国家统计局授权国家统计局授权的数据中心的数据中心中国决策信息网中国决策信息网http:/http:/决策知识及案例决策知识及案例三农数据网三农数据网http:/www.sannong.gov.http:/cn三农信息、论坛三农信息、论坛及相关网站及相关网站表表2-2 2-2 提供统计数据的部分政府网站提供统计数据的部分政府网站华南理工大学精品课程华南理工大学精品课程2121提供统计数据的部分政府网站提供统计数据的部分政府网站美国政府机构美国政府机构 网址网址数据内容数据内容人口普查局人口普查局
15、http:/www.census.govhttp:/www.census.gov人口和家庭等人口和家庭等联邦储备局联邦储备局http:/www.bog.frb.fed.http:/www.bog.frb.fed.usus货币供应、信誉、货币供应、信誉、汇率等汇率等预算编制办公室预算编制办公室http:/www.whitehouse.ghttp:/www.whitehouse.gov/ombov/omb财政收入、支出、财政收入、支出、债券等债券等商务部商务部http:/www.doc.govhttp:/www.doc.gov商业、工业等商业、工业等表表2-2 2-2 提供统计数据的部分政府网站(
16、续表)提供统计数据的部分政府网站(续表)华南理工大学精品课程华南理工大学精品课程2222普查普查 (census)(census)1.1.为特定目的专门组织的非经常性全面调查为特定目的专门组织的非经常性全面调查2.2.通常是一次性或周期性的通常是一次性或周期性的3.3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间4.4.数据的规范化程度较高数据的规范化程度较高5.5.应用范围比较狭窄应用范围比较狭窄华南理工大学精品课程华南理工大学精品课程2323抽样调查抽样调查 (sampling survey)(sampling survey)1.1.从总体中随机抽取一部分单位作为样本进从总
17、体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体行调查,并根据样本调查结果来推断总体特征的数据收集方法特征的数据收集方法 华南理工大学精品课程华南理工大学精品课程2424本节提问本节提问简要说明统计数据的来源?简要说明统计数据的来源?Q1Q2获取直接统计数据的渠道主要有哪些?获取直接统计数据的渠道主要有哪些?华南理工大学精品课程华南理工大学精品课程第三节第三节 统计统计数据的质量数据的质量 统计数据的误差:统计数据的误差:一、抽样误差一、抽样误差二、非抽样误差二、非抽样误差华南理工大学精品课程华南理工大学精品课程2626统计数据的误差统计数据的误差抽抽 样样误误差差抽样框误
18、差回答误差无回答误差调查员误差非非 抽抽样样误误差差数数 据据的的误误差差华南理工大学精品课程华南理工大学精品课程2727抽样误差抽样误差 (sampling errorsampling error)1.1.由于抽样的随机性所带来的误差由于抽样的随机性所带来的误差 2.2.所有样本可能的结果与总体真值之间的平均性所有样本可能的结果与总体真值之间的平均性差异差异 3.3.影响抽样误差大小的因素影响抽样误差大小的因素 样本量的大小样本量的大小 总体的变异性总体的变异性华南理工大学精品课程华南理工大学精品课程2828非抽样误差非抽样误差 (non-sampling errornon-sampling
19、 error)1.1.相对于抽样误差而言相对于抽样误差而言2.2.除抽样误差之外的,由于其他原因造成的样本除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异观察结果与总体真值之间的差异3.3.存在于所有的调查之中存在于所有的调查之中 概率抽样,非概率抽样,全面性调查概率抽样,非概率抽样,全面性调查4.4.有抽样框误差、回答误差、无回答误差、调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差员误差、测量误差华南理工大学精品课程华南理工大学精品课程2929误差的控制误差的控制1.1.抽样误差可计算和控制抽样误差可计算和控制2.2.非抽样误差的控制非抽样误差的控制 调查员
20、的挑选调查员的挑选 调查员的培训调查员的培训 督导员的调查专业水平督导员的调查专业水平 调查过程控制调查过程控制 调查结果进行检验、评估调查结果进行检验、评估 现场调查人员进行奖惩的制度现场调查人员进行奖惩的制度华南理工大学精品课程华南理工大学精品课程3030本节提问本节提问简要说明抽样误差和非抽样误差?简要说明抽样误差和非抽样误差?Q1Q2非抽样误差的控制有哪些途径?非抽样误差的控制有哪些途径?华南理工大学精品课程华南理工大学精品课程第四节第四节 统计统计数据的整理数据的整理一、统计数据的分组一、统计数据的分组 二、次数分配二、次数分配三、次数分配直方图三、次数分配直方图四、洛伦茨曲线四、洛
21、伦茨曲线华南理工大学精品课程华南理工大学精品课程3232统计数据的分组统计数据的分组 统计分组是统计整理的第一步,它是按照统统计分组是统计整理的第一步,它是按照统计研究的目的,将数据分别分入不同的组内。在计研究的目的,将数据分别分入不同的组内。在本章第一节中,我们将数据分成四种计量尺度,本章第一节中,我们将数据分成四种计量尺度,即列名尺度、顺序尺度、间隔尺度和比例尺度。即列名尺度、顺序尺度、间隔尺度和比例尺度。其中列名尺度和顺序尺度的数据是按照事物的性其中列名尺度和顺序尺度的数据是按照事物的性质和属性划分的,因而又称为按品质标志分组;质和属性划分的,因而又称为按品质标志分组;间隔尺度和比例尺度
22、是按照事物的数量标准划分间隔尺度和比例尺度是按照事物的数量标准划分的,又称为数量标志分组。的,又称为数量标志分组。华南理工大学精品课程华南理工大学精品课程3333组距分组组距分组(要点要点)1.1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.2.适合于连续变量适合于连续变量3.3.适合于变量值较多的情况适合于变量值较多的情况4.4.需要遵循需要遵循“不重不漏不重不漏”的原则的原则5.5.可采用等距分组,也可采用可采用等距分组,也可采用 不等距分组不等距分组华南理工大学精品课程华南理工大学精品课程3434组距分组组距分组 (步骤步骤)1.1.确定组数:组数的确定应以能够显示数据的确定
23、组数:组数的确定应以能够显示数据的分布特征和规律为目的分布特征和规律为目的2.2.确定组距:组距确定组距:组距(class width)(class width)是一个组的上是一个组的上限与下限之差,可根据全部数据的最大值和限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即最小值及所分的组数来确定,即 组距组距(最大值最大值 -最小值最小值)组数组数3.3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表华南理工大学精品课程华南理工大学精品课程3535组距分组组距分组 (几个概念几个概念)1.1.下限下限(low limit)low limit):一个组的最
24、小值:一个组的最小值2.2.上限上限(upper limit)upper limit):一个组的最大值:一个组的最大值3.3.组距组距(class width)class width):上限与下限之差:上限与下限之差4.4.组中值组中值(class midpoint)class midpoint):下限与上限之间:下限与上限之间的中点值的中点值华南理工大学精品课程华南理工大学精品课程3636案例分析案例分析 次数分配表的编制次数分配表的编制工人编号周加工零件数工人编号周加工零件数工人编号周加工零件数123456789101068411091109911111071211051112131415
25、16171819209994119881189720310695106212223242526272829308510610110596105107128111101表表2-3 某车间某车间30名工人周加工零件数名工人周加工零件数 (单位:件)(单位:件)华南理工大学精品课程华南理工大学精品课程3737案例分析案例分析 次数分配表次数分配表表表2-4 某车间某车间30名工人周加工零件数的频数分布名工人周加工零件数的频数分布按周加工零件数分组次 数80 9090 100100 110110 120120 130371352合计30华南理工大学精品课程华南理工大学精品课程3838使用使用Excel
展开阅读全文