书签 分享 收藏 举报 版权申诉 / 126
上传文档赚钱

类型第二章统计数据的描述课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3524003
  • 上传时间:2022-09-11
  • 格式:PPT
  • 页数:126
  • 大小:3.97MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第二章统计数据的描述课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第二 统计数据 描述 课件
    资源描述:

    1、华南理工大学精品课程华南理工大学精品课程统计学统计学统计数据的描述统计数据的描述第二章第二章华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述录取中有无歧视录取中有无歧视?某高校只有两个系,财经系和工程系。某高校只有两个系,财经系和工程系。该校报考及录取的总体情况如下:该校报考及录取的总体情况如下:男生男生女生女生录取录取350350200200未录取未录取450450400400报考人数报考人数800800600600引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述 如果我们只看该校男女生录取的如果我们只看该校男女

    2、生录取的比率,即男生比率,即男生350/800=44%,350/800=44%,女生女生200/200/600=33%600=33%。这时我们不免会问,是男同。这时我们不免会问,是男同学的成绩比女同学好,还是在录取中学的成绩比女同学好,还是在录取中存在着性别的歧视?学过统计学的同存在着性别的歧视?学过统计学的同学不会简单地做出结论,而是继续搜学不会简单地做出结论,而是继续搜集数据并得到两个系各自录取的男女集数据并得到两个系各自录取的男女生数据:生数据:引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述工程系工程系财经系财经系男生男生女生女生 男生男生

    3、女生女生录取录取3003001001005050100100未录取未录取300300100100150150300300报考人数报考人数 600600200200200200400400引例:引例:华南理工大学精品课程华南理工大学精品课程第二章第二章 统计数据的描述统计数据的描述 有了分系的录取数据,不难看到工程有了分系的录取数据,不难看到工程系录取的人数比较多,男女生录取的比系录取的人数比较多,男女生录取的比率都是率都是50%50%。而财经系招生名额较少,而财经系招生名额较少,男女生录取的比率都是男女生录取的比率都是25%25%。由于女生。由于女生报财经系的人多,男生报工科的人多,报财经系的

    4、人多,男生报工科的人多,因而导致男生整个录取率偏高,而女生因而导致男生整个录取率偏高,而女生偏低。这个例子告诉我们对数据一是要偏低。这个例子告诉我们对数据一是要从不同角度进行分析,二是要注意权数从不同角度进行分析,二是要注意权数的影响,这就是本章要讨论的问题。的影响,这就是本章要讨论的问题。引例:引例:华南理工大学精品课程华南理工大学精品课程6 6引例提问引例提问录取中有无歧视?录取中有无歧视?Q1Q2Q3统计学怎样对数据进行有效分析?统计学怎样对数据进行有效分析?怎样理解权数对均值的影响?怎样理解权数对均值的影响?华南理工大学精品课程华南理工大学精品课程7 7本章学习内容本章学习内容p1.1

    5、.学习如何用数据对客观事物进行计量,学习如何用数据对客观事物进行计量,如何获取数据以及对数据质量的评价如何获取数据以及对数据质量的评价p2.2.如何对获取的数据进行整理如何对获取的数据进行整理p3.3.数据分布的集中趋势和离散程度数据分布的集中趋势和离散程度p4.4.非正态总体的分布偏态和峰度非正态总体的分布偏态和峰度p5.5.茎叶图和箱线图的特点和优势茎叶图和箱线图的特点和优势p6.6.统计表及统计图统计表及统计图华南理工大学精品课程华南理工大学精品课程8 8本章学习目标本章学习目标p 了解数据的计量尺度了解数据的计量尺度p 了解统计数据的来源和数据的质量要求了解统计数据的来源和数据的质量要

    6、求p 掌握数值型数据的整理方法掌握数值型数据的整理方法p 掌握数据集中趋势和离散程度的测度方法掌握数据集中趋势和离散程度的测度方法p 掌握茎叶图和箱线图的制作方法掌握茎叶图和箱线图的制作方法p 掌握分布偏态与峰度的测度方法掌握分布偏态与峰度的测度方法p 掌握统计表和统计图的使用掌握统计表和统计图的使用华南理工大学精品课程华南理工大学精品课程9 9第一节第一节 数据的计量尺度数据的计量尺度2.12.22.32.42.5第二章具体章节结构第二章具体章节结构 第二节第二节 统计数据的来源统计数据的来源第三节第三节 统计数据的质量统计数据的质量第四节第四节 统计数据的整理统计数据的整理第五节第五节 分

    7、布集中趋势的测度分布集中趋势的测度华南理工大学精品课程华南理工大学精品课程1010第六节第六节 分布离散程度的测度分布离散程度的测度2.62.72.82.9第七节第七节 分布偏态与峰度的测度分布偏态与峰度的测度第八节第八节 茎叶图与箱线图茎叶图与箱线图第九节第九节 统计表与统计图统计表与统计图第二章具体章节结构第二章具体章节结构 华南理工大学精品课程华南理工大学精品课程第一节第一节 数据的计量尺度数据的计量尺度 按照计量学的一般分类方法,对数按照计量学的一般分类方法,对数据分为四种计量尺度,即:据分为四种计量尺度,即:一、列名尺度一、列名尺度二、顺序尺度二、顺序尺度三、间隔尺度三、间隔尺度四、

    8、比率尺度四、比率尺度华南理工大学精品课程华南理工大学精品课程1212列名尺度列名尺度 (Nominal scaleNominal scale)1.1.也称名义尺度或分类尺度也称名义尺度或分类尺度2.2.计量层次最低计量层次最低3.3.对事物进行平行的分类对事物进行平行的分类4.4.各类别可以指定数字代码表示各类别可以指定数字代码表示5.5.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求6.6.数据表现为数据表现为“类别类别”7.7.具有具有=或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1313顺序尺度顺序尺度 (Ordinal scaleOrdina

    9、l scale)1.1.也称定序尺度也称定序尺度2.2.对事物分类的同时给出各类别的顺序对事物分类的同时给出各类别的顺序3.3.比定类尺度精确比定类尺度精确4.4.未测量出类别之间的准确差值未测量出类别之间的准确差值5.5.数据表现为数据表现为“类别类别”,但有序,但有序6.6.具有具有 或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1414间隔尺度间隔尺度 (Interval scaleInterval scale)1.1.也称间隔尺度也称间隔尺度2.2.对事物的准确测度对事物的准确测度3.3.比定序尺度精确比定序尺度精确4.4.数据表现为数据表现为“数值数值”5.5.没

    10、有绝对零点没有绝对零点6.6.具有具有 +或或 -的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1515比率尺度比率尺度 (Ratio scaleRatio scale)1.1.也称比率尺度也称比率尺度2.2.对事物的准确测度对事物的准确测度3.3.与定距尺度处于同一层次与定距尺度处于同一层次4.4.数据表现为数据表现为“数值数值”5.5.有绝对零点有绝对零点6.6.具有具有 或或 的数学特性的数学特性华南理工大学精品课程华南理工大学精品课程1616四种计量尺度的比较四种计量尺度的比较定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度 定比尺度定比尺度 分类分类(=(=,)排序排序

    11、()间距间距(+(+,-)-)比值比值(,)“”表表2-1 2-1 四种计量尺度的比较四种计量尺度的比较华南理工大学精品课程华南理工大学精品课程1717本节提问本节提问数据的计量尺度分为哪几种?数据的计量尺度分为哪几种?Q1Q2Q3不同计量尺度各有什么特点?不同计量尺度各有什么特点?间隔尺度和比例尺度有何区别?间隔尺度和比例尺度有何区别?华南理工大学精品课程华南理工大学精品课程第二节第二节 统计统计数据的来源数据的来源 统计数据来源于直接组织的调统计数据来源于直接组织的调查、观察和科学试验,我们称之为第查、观察和科学试验,我们称之为第一手数据或直接的数据一手数据或直接的数据;或者来源于或者来源

    12、于已有的数据,我们称之为第二手数据已有的数据,我们称之为第二手数据或间接的数据。或间接的数据。一、间接获取的数据一、间接获取的数据 二、直接获取的数据二、直接获取的数据华南理工大学精品课程华南理工大学精品课程1919间接取得的数据间接取得的数据1.1.统计部门和政府部门公布的有关资料,如各类统计部门和政府部门公布的有关资料,如各类统计年鉴统计年鉴2.2.各类经济信息中心、信息咨询机构、专业调查各类经济信息中心、信息咨询机构、专业调查机构等提供的数据机构等提供的数据3.3.各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料4.4.各种会议,如博览会、展销会、交易会及专业各种

    13、会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料性、学术性研讨会上交流的有关资料5.5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料中国统计出版社华南理工大学精品课程华南理工大学精品课程2020提供统计数据的部分政府网站提供统计数据的部分政府网站中国政府及相关机构中国政府及相关机构 网址网址数据内容数据内容国家统计局国家统计局http:/http:/统计年鉴、统计统计年鉴、统计月报等月报等国务院发展研究中心国务院发展研究中心信息网信息网http:/.chttp:/ n宏观经济、财经、宏观经济、财经、货币金融等货币金融等 中国经济信息网中国经济信息网htt

    14、p:/http:/经济信息及各类经济信息及各类网站网站华通数据中心华通数据中心http:/http:/国家统计局授权国家统计局授权的数据中心的数据中心中国决策信息网中国决策信息网http:/http:/决策知识及案例决策知识及案例三农数据网三农数据网http:/www.sannong.gov.http:/cn三农信息、论坛三农信息、论坛及相关网站及相关网站表表2-2 2-2 提供统计数据的部分政府网站提供统计数据的部分政府网站华南理工大学精品课程华南理工大学精品课程2121提供统计数据的部分政府网站提供统计数据的部分政府网站美国政府机构美国政府机构 网址网址数据内容数据内容人口普查局人口普查局

    15、http:/www.census.govhttp:/www.census.gov人口和家庭等人口和家庭等联邦储备局联邦储备局http:/www.bog.frb.fed.http:/www.bog.frb.fed.usus货币供应、信誉、货币供应、信誉、汇率等汇率等预算编制办公室预算编制办公室http:/www.whitehouse.ghttp:/www.whitehouse.gov/ombov/omb财政收入、支出、财政收入、支出、债券等债券等商务部商务部http:/www.doc.govhttp:/www.doc.gov商业、工业等商业、工业等表表2-2 2-2 提供统计数据的部分政府网站(

    16、续表)提供统计数据的部分政府网站(续表)华南理工大学精品课程华南理工大学精品课程2222普查普查 (census)(census)1.1.为特定目的专门组织的非经常性全面调查为特定目的专门组织的非经常性全面调查2.2.通常是一次性或周期性的通常是一次性或周期性的3.3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间4.4.数据的规范化程度较高数据的规范化程度较高5.5.应用范围比较狭窄应用范围比较狭窄华南理工大学精品课程华南理工大学精品课程2323抽样调查抽样调查 (sampling survey)(sampling survey)1.1.从总体中随机抽取一部分单位作为样本进从总

    17、体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体行调查,并根据样本调查结果来推断总体特征的数据收集方法特征的数据收集方法 华南理工大学精品课程华南理工大学精品课程2424本节提问本节提问简要说明统计数据的来源?简要说明统计数据的来源?Q1Q2获取直接统计数据的渠道主要有哪些?获取直接统计数据的渠道主要有哪些?华南理工大学精品课程华南理工大学精品课程第三节第三节 统计统计数据的质量数据的质量 统计数据的误差:统计数据的误差:一、抽样误差一、抽样误差二、非抽样误差二、非抽样误差华南理工大学精品课程华南理工大学精品课程2626统计数据的误差统计数据的误差抽抽 样样误误差差抽样框误

    18、差回答误差无回答误差调查员误差非非 抽抽样样误误差差数数 据据的的误误差差华南理工大学精品课程华南理工大学精品课程2727抽样误差抽样误差 (sampling errorsampling error)1.1.由于抽样的随机性所带来的误差由于抽样的随机性所带来的误差 2.2.所有样本可能的结果与总体真值之间的平均性所有样本可能的结果与总体真值之间的平均性差异差异 3.3.影响抽样误差大小的因素影响抽样误差大小的因素 样本量的大小样本量的大小 总体的变异性总体的变异性华南理工大学精品课程华南理工大学精品课程2828非抽样误差非抽样误差 (non-sampling errornon-sampling

    19、 error)1.1.相对于抽样误差而言相对于抽样误差而言2.2.除抽样误差之外的,由于其他原因造成的样本除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异观察结果与总体真值之间的差异3.3.存在于所有的调查之中存在于所有的调查之中 概率抽样,非概率抽样,全面性调查概率抽样,非概率抽样,全面性调查4.4.有抽样框误差、回答误差、无回答误差、调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差员误差、测量误差华南理工大学精品课程华南理工大学精品课程2929误差的控制误差的控制1.1.抽样误差可计算和控制抽样误差可计算和控制2.2.非抽样误差的控制非抽样误差的控制 调查员

    20、的挑选调查员的挑选 调查员的培训调查员的培训 督导员的调查专业水平督导员的调查专业水平 调查过程控制调查过程控制 调查结果进行检验、评估调查结果进行检验、评估 现场调查人员进行奖惩的制度现场调查人员进行奖惩的制度华南理工大学精品课程华南理工大学精品课程3030本节提问本节提问简要说明抽样误差和非抽样误差?简要说明抽样误差和非抽样误差?Q1Q2非抽样误差的控制有哪些途径?非抽样误差的控制有哪些途径?华南理工大学精品课程华南理工大学精品课程第四节第四节 统计统计数据的整理数据的整理一、统计数据的分组一、统计数据的分组 二、次数分配二、次数分配三、次数分配直方图三、次数分配直方图四、洛伦茨曲线四、洛

    21、伦茨曲线华南理工大学精品课程华南理工大学精品课程3232统计数据的分组统计数据的分组 统计分组是统计整理的第一步,它是按照统统计分组是统计整理的第一步,它是按照统计研究的目的,将数据分别分入不同的组内。在计研究的目的,将数据分别分入不同的组内。在本章第一节中,我们将数据分成四种计量尺度,本章第一节中,我们将数据分成四种计量尺度,即列名尺度、顺序尺度、间隔尺度和比例尺度。即列名尺度、顺序尺度、间隔尺度和比例尺度。其中列名尺度和顺序尺度的数据是按照事物的性其中列名尺度和顺序尺度的数据是按照事物的性质和属性划分的,因而又称为按品质标志分组;质和属性划分的,因而又称为按品质标志分组;间隔尺度和比例尺度

    22、是按照事物的数量标准划分间隔尺度和比例尺度是按照事物的数量标准划分的,又称为数量标志分组。的,又称为数量标志分组。华南理工大学精品课程华南理工大学精品课程3333组距分组组距分组(要点要点)1.1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.2.适合于连续变量适合于连续变量3.3.适合于变量值较多的情况适合于变量值较多的情况4.4.需要遵循需要遵循“不重不漏不重不漏”的原则的原则5.5.可采用等距分组,也可采用可采用等距分组,也可采用 不等距分组不等距分组华南理工大学精品课程华南理工大学精品课程3434组距分组组距分组 (步骤步骤)1.1.确定组数:组数的确定应以能够显示数据的确定

    23、组数:组数的确定应以能够显示数据的分布特征和规律为目的分布特征和规律为目的2.2.确定组距:组距确定组距:组距(class width)(class width)是一个组的上是一个组的上限与下限之差,可根据全部数据的最大值和限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即最小值及所分的组数来确定,即 组距组距(最大值最大值 -最小值最小值)组数组数3.3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表华南理工大学精品课程华南理工大学精品课程3535组距分组组距分组 (几个概念几个概念)1.1.下限下限(low limit)low limit):一个组的最

    24、小值:一个组的最小值2.2.上限上限(upper limit)upper limit):一个组的最大值:一个组的最大值3.3.组距组距(class width)class width):上限与下限之差:上限与下限之差4.4.组中值组中值(class midpoint)class midpoint):下限与上限之间:下限与上限之间的中点值的中点值华南理工大学精品课程华南理工大学精品课程3636案例分析案例分析 次数分配表的编制次数分配表的编制工人编号周加工零件数工人编号周加工零件数工人编号周加工零件数123456789101068411091109911111071211051112131415

    25、16171819209994119881189720310695106212223242526272829308510610110596105107128111101表表2-3 某车间某车间30名工人周加工零件数名工人周加工零件数 (单位:件)(单位:件)华南理工大学精品课程华南理工大学精品课程3737案例分析案例分析 次数分配表次数分配表表表2-4 某车间某车间30名工人周加工零件数的频数分布名工人周加工零件数的频数分布按周加工零件数分组次 数80 9090 100100 110110 120120 130371352合计30华南理工大学精品课程华南理工大学精品课程3838使用使用Excel

    26、Excel频数函数频数函数 (FREQUENCY)(FREQUENCY)ExcelExcel的的“直方图直方图”工具的缺陷是:频数分布和工具的缺陷是:频数分布和直方图没有与数据联系起来,这样,如果你改直方图没有与数据联系起来,这样,如果你改变任何一个数据,频数分布表和直方图不会跟变任何一个数据,频数分布表和直方图不会跟着改变着改变 使用使用ExcelExcel中的统计函数中的统计函数“FREQUENCYFREQUENCY”来创建来创建 频数分布表和直方图,可解决这一问题。频数分布表和直方图,可解决这一问题。华南理工大学精品课程华南理工大学精品课程3939使用使用ExcelExcel频数函数频数

    27、函数 (FREQUENCY)(FREQUENCY)创建频数分布表的步骤是:创建频数分布表的步骤是:选择与接受区域相临近的单元格区域,作为选择与接受区域相临近的单元格区域,作为频数分布表输出的区域频数分布表输出的区域选择统计函数中的选择统计函数中的“FREQUENCY”FREQUENCY”函数函数在对话框在对话框 Date-array Date-array 后输入数据区域,在后输入数据区域,在Bins-arrayBins-array后输入接受区域后输入接受区域同时按下同时按下ctrl-shift-Enterctrl-shift-Enter组合键,即得到组合键,即得到频数分布频数分布华南理工大学精

    28、品课程华南理工大学精品课程4040分组数据的图示分组数据的图示 (直方图的绘制直方图的绘制)809010011012013004812图图2-1 2-1 某车间工人周加工零件直方图某车间工人周加工零件直方图华南理工大学精品课程华南理工大学精品课程4141分组数据的图示分组数据的图示 (折线图的绘制折线图的绘制)809010011012013004812折线图与直方图下的面积相等!华南理工大学精品课程华南理工大学精品课程4242次数分配的类型次数分配的类型华南理工大学精品课程华南理工大学精品课程4343洛伦茨曲线洛伦茨曲线1.1.2020世纪初美国经济学家、统计学家洛伦茨世纪初美国经济学家、统计

    29、学家洛伦茨(M.(M.E.Lorentz)E.Lorentz)根据意大利经济学家巴雷特根据意大利经济学家巴雷特(V.(V.Pareto)Pareto)提出的收入分配公式绘制而成提出的收入分配公式绘制而成2.2.描述收入和财富分配性质描述收入和财富分配性质的曲线分析该国家或地区的曲线分析该国家或地区分配的平均程度分配的平均程度AB华南理工大学精品课程华南理工大学精品课程4444基尼系数基尼系数1.1.2020世纪初意大利经济学家基尼世纪初意大利经济学家基尼(G.(G.GiniGini)根据洛根据洛伦茨曲线给出了衡收入分配平均程度的指标伦茨曲线给出了衡收入分配平均程度的指标2.2.A A表示实际收

    30、入曲线与绝对平均线之间的面积表示实际收入曲线与绝对平均线之间的面积3.3.B B表示实际收入曲线与绝对不平均线之间的面积表示实际收入曲线与绝对不平均线之间的面积4.4.如果如果A=0A=0,则基尼系数,则基尼系数=0=0,表示收入绝对平均,表示收入绝对平均=AAB基尼系数华南理工大学精品课程华南理工大学精品课程4545基尼系数基尼系数5.5.如果如果B=0B=0,则基尼系数,则基尼系数=1=1,表示收入绝对不平均,表示收入绝对不平均6.6.基尼系数在基尼系数在0 0 和和1 1之间取值之间取值7.7.一般认为:一般认为:基尼系数若小于基尼系数若小于0.20.2,表明分配平均;,表明分配平均;基

    31、尼系数在基尼系数在0.20.2至至0.40.4之间是比较适当的,之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;即一个社会既有效率又没有造成极大的分配不公;基尼系数在基尼系数在0.40.4被认为是收入分配不公平的警戒线,被认为是收入分配不公平的警戒线,超过了超过了0.40.4应该采取措施缩小这一差距。应该采取措施缩小这一差距。AB华南理工大学精品课程华南理工大学精品课程4646本节提问本节提问描述次数分配表的编制过程。描述次数分配表的编制过程。Q1Q2Q3解释洛伦茨曲线及其用途。解释洛伦茨曲线及其用途。说明基尼系数的含义和用途。说明基尼系数的含义和用途。华南理工大学精品课程华南理

    32、工大学精品课程第五节第五节 分布集中趋势的测度分布集中趋势的测度一、众数一、众数二、中位数二、中位数三、四分位数三、四分位数四、均值四、均值五、几何均值五、几何均值六、切尾均值六、切尾均值七、众数、中位数和均值的比较七、众数、中位数和均值的比较华南理工大学精品课程华南理工大学精品课程4848众数众数 (modemode)1.1.一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.2.适合于数据量较多时使用适合于数据量较多时使用3.3.不受极端值的影响不受极端值的影响4.4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数5.5.主要用于分类数据,也可用于顺序数据和数

    33、主要用于分类数据,也可用于顺序数据和数值型数据值型数据华南理工大学精品课程华南理工大学精品课程4949众数众数 (不惟一性不惟一性)无众数无众数原始数据原始数据:11 3 7 12 9 8:11 3 7 12 9 8华南理工大学精品课程华南理工大学精品课程5050中位数中位数 (medianmedian)1.1.排序后处于中间位置上的值排序后处于中间位置上的值e1minniixM华南理工大学精品课程华南理工大学精品课程5151中位数中位数 (位置的确定位置的确定)华南理工大学精品课程华南理工大学精品课程5252案例分析案例分析 (9(9个数据的算例个数据的算例)华南理工大学精品课程华南理工大学

    34、精品课程5353案例分析案例分析 (10(10个数据的算例个数据的算例)华南理工大学精品课程华南理工大学精品课程5454四分位数四分位数 (quartilequartile)1.1.排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值华南理工大学精品课程华南理工大学精品课程5555四分位数四分位数 (位置的确定位置的确定)华南理工大学精品课程华南理工大学精品课程5656案例分析案例分析 (四分位数四分位数7 7个数据的算例个数据的算例)华南理工大学精品课程华南理工大学精品课程5757案例分析案例分析(四分位数四分位数1010个数据的算例个数据的算例)华南理工大学精品课程华南理工

    35、大学精品课程5858均值均值 (meanmean)1.1.集中趋势的最常用测度值集中趋势的最常用测度值2.2.一组数据的均衡点所在一组数据的均衡点所在3.3.体现了数据的必然性特征体现了数据的必然性特征4.4.易受极端值的影响易受极端值的影响5.5.用于数值型数据,不能用于分类数据和顺序用于数值型数据,不能用于分类数据和顺序数据数据华南理工大学精品课程华南理工大学精品课程5959简单均值简单均值 (simple mean)(simple mean)华南理工大学精品课程华南理工大学精品课程6060加权均值加权均值 (weighted mean)(weighted mean)华南理工大学精品课程华

    36、南理工大学精品课程6161案例分析案例分析 加权均值加权均值按零件数分按零件数分组组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计506160.0 表表2-5 某车间某车间50名工人日加工零件均值计算表名工人日加工零件均值计算表华南理工大学精品课程华南理工大学精品课程6262均值均值 (数学性质数学性质)1.1.各变量值与均值的离差之和等于零

    37、各变量值与均值的离差之和等于零21()minniixx1()0niixx华南理工大学精品课程华南理工大学精品课程6363几何均值几何均值 (geometric meangeometric mean)1.1.n n 个变量值乘积的个变量值乘积的 n n 次方根次方根2.2.适用于对比率数据的平均适用于对比率数据的平均3.3.主要用于计算平均增长率主要用于计算平均增长率4.4.计算公式为计算公式为:121nnnmniiGxxxx112lg1lg(lglglg)niimnxGxxxnn 华南理工大学精品课程华南理工大学精品课程6464案例分析案例分析 几何均值几何均值 【例例】一位投资者购持有一种股

    38、票,在一位投资者购持有一种股票,在19199797年、年、19981998年、年、19991999年和年和20002000年收益率分年收益率分别为别为 4.5%4.5%、2.0%2.0%、3.5%3.5%、5.4%5.4%。计算该。计算该投资者在这四年内的平均收益率投资者在这四年内的平均收益率 华南理工大学精品课程华南理工大学精品课程6565切尾均值切尾均值 (trimmed Mean)(trimmed Mean)(1)(2)()2nnn nxxxxnn 1.1.去掉大小两端的若干数值后计算中间数据的均去掉大小两端的若干数值后计算中间数据的均值值2.2.在电视大奖赛、体育比赛及需要人们进行综合

    39、在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用评价的比赛项目中已得到广泛应用3.3.计算公式为计算公式为:102华南理工大学精品课程华南理工大学精品课程6666案例分析案例分析 切尾均值切尾均值【例例】某次求职面试中共有某次求职面试中共有1111名评委,对某位求职名评委,对某位求职者的给分分别是:者的给分分别是:123456,9.22,9.25,9.20,9.30,9.65,9.30,xxxxxx(1)(2)(3)(4)(5)(6),9.20,9.20,9.22,9.24,9.25,9.25,xxxxxx(7)(8)(9)(10)(11),9.27,9.28,9.30,

    40、9.30,9.65xxxxx 1 11/1 111 11/1 121 11 11/1 11/1 1(2)(3)(1 0)1 121 11/1 1 1 129.29.2 29.3 9.2 69xxxxxxx7891011,9.27,9.20,9.28,9.25,9.24xxxxx华南理工大学精品课程华南理工大学精品课程6767众数、中位数和均值的关系众数、中位数和均值的关系图图2-4 2-4 众数、中位数和均值的关系众数、中位数和均值的关系华南理工大学精品课程华南理工大学精品课程6868众数、中位数、均值的众数、中位数、均值的特点和应用特点和应用1.1.众数众数 -不受极端值影响不受极端值影响

    41、-具有不惟一性具有不惟一性 -数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.2.中位数中位数 -不受极端值影响不受极端值影响 -数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.3.均值均值 -易受极端值影响易受极端值影响 -数学性质优良数学性质优良 -数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用小结小结数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据定距数据定比数据定比数据适适用用的的测测度度值值众数众数中位数中位数算术平均数算术平均数算术平均数算术平均数四分位数四分位数众数众数调和

    42、平均数调和平均数众数众数中位数中位数几何平均数几何平均数四分位数四分位数 中位数中位数四分位数四分位数众数众数红色为该数据类型最适合用的测度值华南理工大学精品课程华南理工大学精品课程7070本节提问本节提问一组数据的分布特征可以从哪几个一组数据的分布特征可以从哪几个方面进行测度?方面进行测度?Q1Q2Q3怎样理解均值在统计学中的地位?怎样理解均值在统计学中的地位?对于比率数据的平均,为什么采对于比率数据的平均,为什么采用几何平均?用几何平均?简述众数、中位数和均值的特简述众数、中位数和均值的特点和应用场合。点和应用场合。Q4华南理工大学精品课程华南理工大学精品课程第六节第六节 分布离散程度的测

    43、度分布离散程度的测度一、极差一、极差二、内距二、内距三、方差和标准差三、方差和标准差四、离散系数四、离散系数华南理工大学精品课程华南理工大学精品课程7272极差极差 (rangerange)1.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.2.离散程度的最简单测度值离散程度的最简单测度值3.3.易受极端值影响易受极端值影响4.4.未考虑数据的分布未考虑数据的分布华南理工大学精品课程华南理工大学精品课程7373内距内距 (Inter-Quartile(Inter-Quartile Range,IQRRange,IQR)1.1.也称四分位差也称四分位差2.2.上四分位数与下四分位

    44、数之差上四分位数与下四分位数之差 内内 距距 =Q Q3 3 Q Q1 13.3.反映了中间反映了中间50%50%数据的离散程度数据的离散程度4.4.不受极端值的影响不受极端值的影响5.5.可用于衡量中位数的代表性可用于衡量中位数的代表性华南理工大学精品课程华南理工大学精品课程7474案例分析案例分析 四分位差四分位差回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300表表2-6 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布

    45、华南理工大学精品课程华南理工大学精品课程7575方差和标准差方差和标准差(VarianceVariance and and Standard deviationStandard deviation)1.离散程度的测度值之一离散程度的测度值之一2.2.最常用的测度值最常用的测度值3.3.反映了数据的分布反映了数据的分布4.4.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异5.5.根据总体数据计算的,称为总体方差或标准差;根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差根据样本数据计算的,称为样本方差或标准差华南理工大学精品课程华南理工大学精品课程7

    46、676总体方差和标准差总体方差和标准差 (Population(Population varvarianceiance and and Standard deviationStandard deviation)未分组数据未分组数据:221()NiixN21()NiixN221()KiiiMfN21()KiiiMfN华南理工大学精品课程华南理工大学精品课程7777案例分析案例分析 总体标准差计算过程及结果总体标准差计算过程及结果表表2-7 某车间某车间50名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(X Xi i)频数频数(F Fi i)(X Xi

    47、 i-X X)2 2(X Xi i-X X)2 2F Fi i105105 110110110110 115115115115 120120120120125125125125 130130130130 135135135135 140140107.5107.5112.5112.5117.5117.5122.5122.5127.5127.5132.5132.5137.5137.53 35 58 8141410106 64 4246.49246.49114.49114.4932.4932.490.490.4918.4918.4986.4986.49204.49204.49739.47739.47

    48、572.45572.45259.92259.926.866.86184.90184.90518.94518.94817.96817.96合计合计50503100.53100.5华南理工大学精品课程华南理工大学精品课程7878样本方差和标准差样本方差和标准差 (simple(simple variancvariance e and and standard deviationstandard deviation)221()1niixxsn21()1niixxsn221()1kiiiMx fsn21()1kiiiMxfsn华南理工大学精品课程华南理工大学精品课程7979样本方差样本方差 自由度自由

    49、度(degree of freedo(degree of freedom)m)1.1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.2.当样本数据的个数为当样本数据的个数为 n n 时,若样本均值时,若样本均值 x x 确定确定后后,只有只有n n-1-1个数据可以自由取值,其中必有一个数据可以自由取值,其中必有一个数据则不能自由取值个数据则不能自由取值3.3.例如,样本有例如,样本有3 3个数值,即个数值,即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则,则 x x=5=5。当。当 x x =5=5 确定后,确定后,x x1 1,x x2 2和

    50、和x x3 3有两个有两个数据可以自由取值,另一个则不能自由取值,数据可以自由取值,另一个则不能自由取值,比如比如x x1 1=6=6,x x2 2=7=7,那么,那么x x3 3则必然取则必然取2 2,而不能取,而不能取其他值其他值4.4.样本方差用自由度去除,其原因可从多方面解释,样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差方差去估计总体方差2 2时,它是时,它是2 2的无偏估计的无偏估计量量华南理工大学精品课程华南理工大学精品课程8080案例分析案例分析 样本方差样本方差 样本方差与标准差样

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第二章统计数据的描述课件.ppt
    链接地址:https://www.163wenku.com/p-3524003.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库