书签 分享 收藏 举报 版权申诉 / 179
上传文档赚钱

类型配套课件-统计学1.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3394322
  • 上传时间:2022-08-26
  • 格式:PPT
  • 页数:179
  • 大小:1.72MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《配套课件-统计学1.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    配套 课件 统计学
    资源描述:

    1、第一章绪论目录什么是统计 1统计学的产生与发展2统计学的基本概念3第一节什么是统计一、统计的涵义一、统计的涵义 所谓统计,它是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。统计的研究对象具有以下特点:(一一)数量性数量性(二二)总体性总体性(三三)变异性变异性第一节什么是统计二、统计研究的基本环节二、统计研究的基本环节(一一)统计设计统计设计(二二)收集数据收集数据(三三)整理与分析整理与分析(四四)统计资料的积累、开发与应用统计资料的积累、开发与应用图1-1统计研究的全过程第二节统计学的产生与发展一、统计学的主要流派一、统计学的主要流派(一一)政治

    2、算术学派政治算术学派(二二)国势学派国势学派(三三)社会统计学派社会统计学派(四四)数理统计学派数理统计学派第二节统计学的产生与发展二、统计学发展的新动向二、统计学发展的新动向 首先,作为方法论科学的统计学与各实质性学科的结合越来越紧密。其次,国际统计学界的主流也从原来的偏重数理统计学的研究向更加重视应用统计研究转变。再次,统计学与计算机科学和信息科学的结合越来越紧密。第二节统计学的产生与发展三、理论统计学和应用统计学三、理论统计学和应用统计学 现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究

    3、对象的应用统计学。理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。应用统计学则与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。第二节统计学的产生与发展四、统计学与有关学科的联系与区别四、统计学与有关学科的联系与区别 数学是与统计学关系非常密切的一门科学。数学与统计学都是研究数量规律的,都要利用各种公式进行运算。现代统计学中运用了大量的数学理论与数学方法。统计学虽然与数学有密切的联系,但两者之间也存在本质的区别。统计学中的应用统计学与相关的实质性学科如经济学等,有十分密切的联系。数学

    4、、经济学和统计学是三门不同的学科,但其相互之间也有所交叉和重叠。第三节统计学的基本概念一、总体与总体单位一、总体与总体单位 所谓统计总体,就是根据一定目的确定的所要研究的事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。总体单位(简称单位)是组成总体的各个个体。根据研究目的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。总体和单位的概念是相对而言的,随着研究目的不同、总体范围不同而变化。同一个研究对象,在一种情况下为总体,但在另一种情况下又可能变成单位。第三节统计学的基本概念二、样本二、样本 统计研究的目的是要确定总体的数量特征。但是,当总

    5、体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对象的事物全体构成的总体(又称母体)中,抽取一部分单位,作为总体的代表加以研究。这种由总体的部分单位组成的集合,称为样本(又称子样)。样本也是由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。第三节统计学的基本概念三、标志三、标志 总体各单位普遍具有的属性或特征称为标志。标志分为品质标志和数量标志两种。尽管标志是总体各单位都具有的普遍属性,但各单位有关标志的具体表现却未必相同。第三节统计学的基本概念四、统计指标与指标体系四、统计指标与指标体系 统计指标是反映统计总体数量特征的

    6、概念和数值。统计指标是由两项基本要素构成的,即指标的概念(名称)和指标的取值。统计指标体系是由一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存、相互制约的关系。第二章第二章 数据的收集、整理数据的收集、整理 与显示与显示目录数据的收集数据的收集1数据的整理数据的整理2数据的显示数据的显示3第一节数据的收集一、数据概述一、数据概述(一一)数据的基本概念数据的基本概念 我们身边随时都存在各种各样的数据:社会数据、商务与经济统计数据、自然统计数据、医学研究数据、卫生统计数据、体育统计数据,以及网络统计数据等。数据时时存在、处处存在。我们可以做出如下定义:在统计中,说明某种客

    7、观现象的数量特征的数字叫统计数据。第一节数据的收集(二二)数据的计量尺度数据的计量尺度 1.定类尺度 2.定序尺度 3.定距尺度 4.定比尺度(三三)数据的类型数据的类型 1.品质数据和数量数据 2.横截面数据、时间序列数据和面板数据。3.调查数据和实验数据 4.直接数据和间接数据第一节数据的收集二、数据收集的方法及形式二、数据收集的方法及形式(一一)直接观察法直接观察法(二二)报告法报告法(三三)采访法采访法(四四)登记法登记法(五五)实验设计法实验设计法第一节数据的收集三、统计调查体系及方案设计三、统计调查体系及方案设计(一一)统计调查形式统计调查形式 1.普查 2.统计报表制度 3.抽样

    8、调查 4.重点调查 5.典型调查(二二)统计调查体系统计调查体系 统计调查体系是指若干相互联系的统计调查方法所构成的整体。对于复杂的经济、社会现象,要了解其数量变化情况,客观上需要区别不同的研究对象和研究目的,采取不同的调查方法。第一节数据的收集(三三)数据收集方案设计数据收集方案设计 1.明确调查目的why 2.确定调查对象和调查单位who 3.确定调查项目what 4.调查表格和问卷的设计 5.确定调查时间when 6.确定调查的组织实施计划第一节数据的收集四、间接统计数据的主要来源四、间接统计数据的主要来源 统计数据的主要来源包括直接来源和间接来源两个渠道。对于应用统计数据进行分析的人员

    9、而言,有可供利用的间接数据是最经济的,只有缺乏间接数据或因为各种原因间接数据不可采用时,才去获取直接数据。来源于系统内部的间接数据包括系统内的业务数据。来源于系统外部的间接数据包括统计部门和政府部门公布的有关资料。第二节数据的整理一、数据整理概述一、数据整理概述(一一)统计数据整理的内容统计数据整理的内容(1)根据研究目的设计整理汇总方案。(2)根据汇总方案,对各个调查项目的资料进行汇总,通过汇总计算各项指标。(3)通过统计表或统计图的形式,描述整理的结果。(二二)数据整理的程序数据整理的程序(1)统计数据的审核与检验。(2)数据的分组和汇总。(3)数据的表示与描述。(4)统计资料的积累、保管

    10、和公布。第二节数据的整理二、统计分组二、统计分组(一一)统计分组的概念与种类统计分组的概念与种类 1.统计分组的概念 根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组的对象是总体。统计分组标志可以是品质标志,也可以是数量标志。2.统计分组的作用(1)划分社会经济现象的类型。(2)反映现象的内部结构及其比例关系。(3)分析现象之间的依存关系。第二节数据的整理 3.统计分组的原则 所谓穷尽原则,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。所谓互斥原则,就是在特定的分组标志下,总体中的任

    11、何一个单位只能归属于某一组,而不能同时或可能归属于几个组。4.统计分组的种类(1)按某一分组的标志的多少和组合情况,分为简单分组和复合分组。(2)按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。(3)按分组的作用和任务不同,分为类型分组、结构分组和分析分组。第二节数据的整理(二二)统计分组的方法统计分组的方法 1.正确选择分组标志 2.按照品质标志分组 3.按照数量标志分组(1)单项式分组与组距式分组。(2)间断组距式分组和连续组距式分组。(3)等距分组与异距分组。第二节数据的整理(三三)组距式分组中相关指标的计算组距式分组中相关指标的计算 1.组距 2.组数

    12、3.组中值 4.开口组的组距与组中值第二节数据的整理三、频数分布三、频数分布(一一)频数分布的基本概念与要素频数分布的基本概念与要素 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布。根据分组标志特征的不同,分布数列可分为两类:按品质标志分组所形成的数列即品质分布数列,亦称品质数列;按数量标志分组所形成的数列叫变量分布数列,亦称变量数列。(二二)变量数列的编制变量数列的编制 统计调查所收集的原始资料,是比较分散、零乱的,无法显示现象总体的本质特征。一般来说,对所收集的资料按标志值大小进行排序,再观察各标志值分布是否均匀,决定是否采用等距分组。第二节数据的整理(三三)累计

    13、频数与累计频率累计频数与累计频率 累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。(四四)频数分布的类型频数分布的类型 1.钟形分布 2.U形分布 3.J形分布第三节数据的显示一、统计表一、统计表(一一)统计表的定义和结构统计表的定义和结构 统计表有广义和狭义之分。广义的统计表包括调查表、登记表、过渡表及表达最后结果的分析表。狭义的统计表是指分析表。下面简述狭义统计表的结构

    14、和编制。从形式上看,统计表由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计是由主词和宾词两部分构成。主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。第三节数据的显示(二二)统计表的种类统计表的种类 1.按照主词是否分组及分组的情况,统计表可分为简单表、简单分组表和复合分组表。2.根据宾词分类,统计表可分为简单排列、平行排列和重叠排列 3.按照用途,广义统计表可分为调查表、整理表和分析表第三节数据的显示(三三)统计表的设计统计表的设计(1)统计表的各种标题应简明、确切地表达其内容,特别是总标题,应十分简要地概括出统计表的基本内容和表中资料所属的时间、地点。

    15、(2)表中主栏各行和宾栏各列,一般是按先局部后整体的原则排列。(3)如栏次较多,通常要加以编号。(4)表中数字应对准位数、填写整齐。(5)统计表中必须注明计量单位。(6)统计表的表式通常是左右开口的,即左右两端不画纵线。(7)必要时,应在统计表下方注明表中某些资料的来源或对某些数据的计算方法、计算口径作出说明。第三节数据的显示二、统计图二、统计图(一一)几何图几何图 1.条形图 2.圆形图 3.直方图 4.折线图 5.曲线图第三节数据的显示(二二)象形图象形图 象形图是以统计资料所反映的实物的形象来表明数据内容,以图形的大小、多少来表明数据的统计图形,常见的有脸谱图、树谱图等。(三三)统计地图

    16、统计地图 统计地图是指在地图上标明各种线、色、点、形来表明数据在空间的分布状况的图形。第三节数据的显示三、统计分析报告三、统计分析报告 统计分析报告是指对统计资料经过系统整理并进行了深入分析之后,将所得的分析研究结果用文字报告(结合相应图表及模型)的形式表达,以供有关方面参考或使用。可以分为如下四部分:(1)基本情况。(2)成绩和经验。(3)问题和原因。(4)建议与措施。第三章第三章 数据分布特征描述数据分布特征描述目录统计变量集中趋势的测定统计变量集中趋势的测定1统计变量离散程度的测定统计变量离散程度的测定2变量分布的特征描述变量分布的特征描述3第一节统计变量集中趋势的测定一、测定集中趋势的

    17、意义一、测定集中趋势的意义(一一)反映总体各单位标志值的一般水平和集中趋势反映总体各单位标志值的一般水平和集中趋势(二二)比较各个同质总体在同一时期的发展水平比较各个同质总体在同一时期的发展水平(三三)比较同一总体在不同时期的发展水平及变化趋势比较同一总体在不同时期的发展水平及变化趋势第一节统计变量集中趋势的测定二、位置代表值二、位置代表值(一一)中位数的计算中位数的计算 如果将总体中各单位的标志值按大小顺序排列,则处于数列中点位置的标志值就是中位数。用中位数来代表总体的一般水平可以避免受总体中极端标志值的影响,有时更有代表性。1.下限公式Me=LMe+dMe 2.上限公式Me=uMe-dMe

    18、 式中:Me为中位数;LMe和uMe分别为中位数组的下限和上限;dMe为中位数组的组距;SMe-1和SMe+1分别为向上(和向下)累计至中位数组的前(和后)一组止的次数;fMe为中位数组的次数。第一节统计变量集中趋势的测定(二二)众数的计算众数的计算 众数是总体分布数列中出现次数最多的标志值,表示社会经济现象总体中最经常出现的标志值。利用众数作为现象一般水平的代表,有其独到的地方。1.下限公式Mo=LMo+dMo 2.上限公式Mo=UMo-dMo 式中:Mo为众数;LMo和UMo分别为众数组的下限和上限;dMo为众数组的组距;1=fMo-fMo-1为众数组与前一组次数之差;2=fMo-fMo+

    19、1为众数组与后一组次数之差。第一节统计变量集中趋势的测定三、数值平均数三、数值平均数 平均指标是反映社会经济总体各单位数量标志表现一般水平的综合指标。(一一)算术平均数算术平均数 1.简单算术平均数 2.加权算术平均数 3.中位数、众数和算术平均数的关系 4.是非标志平均数第一节统计变量集中趋势的测定(二二)调和平均数调和平均数 1.调和平均数的计算方法(1)简单调和平均数。(2)加权调和平均数。2.比值平均数(1)计算相对数的平均水平。(2)计算平均数的平均数。(三三)几何平均数几何平均数 1.简单几何平均数 2.加权几何平均数第一节统计变量集中趋势的测定(四四)几何平均数、算术平均数、调和

    20、平均数之间的关系几何平均数、算术平均数、调和平均数之间的关系 几何平均数、算术平均数、调和平均数都有自己的应用条件,应用时必须认真考虑研究的要求,选用适当的平均数和计算形式。但就数量关系而言,对同一变量值计算几何平均数、算术平均数、调和平均数,会发现它们的大小顺序是固定不变的,即几何平均数大于调和平均数,而算术平均数又大于几何平均数。(五五)平均指标的应用平均指标的应用 1.把平均指标和总量指标结合起来运用 2.以组平均数补充总平均数 3.把平均指标和分布数列分析结合起来 4.把平均指标和具体情况分析结合起来第二节统计变量离散程度的测定一、测定离散程度的意义一、测定离散程度的意义 在社会经济统

    21、计研究中,变异(离散)指标有它的重要作用。首先,利用变异(离散)指标可以说明现象变动的均匀性或稳定性程度。其次,在投资决策中,通常利用变异(离散)指标来估算投资风险程度,人们总是希望投资的收益愈多愈好,同时风险愈小愈好,但实际上收益与风险是一对矛盾,一般不可能风险小而收益大。再次,变异(离散)指标可以说明平均指标的代表性程度。最后,变异(离散)指标可以用来研究总体单位变量值的分布偏离正态的情况。第二节统计变量离散程度的测定二、极差、四分位差和平均差二、极差、四分位差和平均差(一一)极差极差 极差(也称全距)是指总体各单位标志值中最大值和最小值之差,用来表示标志值的变动范围。通常用R表示,即:R

    22、=max-min 极差系数=极差算术平均数(二二)四分位差四分位差 如果将总体中各单位的标志值按从小到大顺序排列,则处于数列3/4位次的标志值减去处于1/4位次的标志值之差再除以2而得的值就是四分位差。(三三)平均差平均差 因为各标志值对算术平均数离差总和等于零,因而离差平均数也一定等于零,不能反映离差的平均程度。用离差绝对值求平均数,可以消除正负号的影响,反映各标志值与算术平均数绝对离差大小的平均程度。第二节统计变量离散程度的测定三、方差与标准差三、方差与标准差(一一)方差和标准差的计算方法方差和标准差的计算方法 方差和标准差是测度标志变异最重要、最常用的指标。方差是总体中各单位标志值对算术

    23、平均数离差平方的平均数;即先求各单位标志值与算术平均数之差,并将离差加以逐项平方,然后求总和再除以项数便得到方差,以2表示。方差是由离差平方计算平均数,所以其计量单位是原来单位的平方。标准差则是方差开方的结果,它恢复了原来的计量单位,可以反映标志值与算术平均数离差的平均水平,所以也称为均方差。第二节统计变量离散程度的测定(二二)总方差、组间方差和组内方差总方差、组间方差和组内方差 在资料分组的情况下,利用组平均数所求的方差和利用标志值直接求得的方差是不同的,这一点和利用组平均数求总体平均数的结果完全不同。现在把各单位标志值对平均数所计算的方差称为总方差,用2表示。把各组平均数对总平均数所计算的

    24、方差称为组间方差,用2表示。第i组标志值和组平均数所计算的方差称为第i组的组内方差,用表示。第二节统计变量离散程度的测定(三三)方差的数学性质方差的数学性质(1)变量的方差等于变量平方的平均数减平均数的平方。(2)变量与算术平均数离差平方和具有最小的性质,即变量与算术平均数计算的方差小于变量与任何其他常数计算的方差。(3)变量线性变换的方差等于变量的方差乘以变量系数的平方。(4)n个独立总体各变量代数和的方差等于各变量方差的代数和。(5)n个独立总体各变量代数和的标准差不大于各变量标准差的代数和。(四四)是非标志的标准差是非标志的标准差 上一节介绍了是非标志平均数的计算,本节进一步介绍其标准差

    25、的计算方法。仍以0表示总体中不具有某种性质的单位标志值,以1表示总体中具有某种性质的单位标志值。第二节统计变量离散程度的测定四、离散系数与异众比率四、离散系数与异众比率(一一)离散系数离散系数(变异系数变异系数)变异(离散)指标的大小不仅取决于总体的变异程度,还与标志值绝对水平高低有关,所以不同总体的单位如果标志值绝对水平相差大,是不宜直接用变异(离散)指标来比较它们的变异程度的。此时,适用的是离散系数(也称变异系数),它为标志值的变异(离散)指标与标志值的算术平均数的比值,其中最常用的离散系数是标准差系数。(二二)异众比率异众比率 异众比率(Variation ratio)又称离异比率或变差

    26、比,指的是非众数(组)的次数(频数)与全部变量值总次数的比率,即众数不能代表的那一部分变量值在总体中的比重。第三节变量分布的特征描述一、矩的概念一、矩的概念 矩也称为动差,是源自物理学的一个概念。二、偏度二、偏度 偏度(系数)是度量总体标志值频率分布不对称程度或偏斜程度的指标。它是利用K阶中心矩中变量值对平均数正负离差相互抵消的原理。第三节变量分布的特征描述三、峰度三、峰度 峰度(系数)是度量频率分布中邻近平均数的标志值集中程度,亦即分布曲线的尖峭程度的指标。它是以四阶中心矩除以标准差的4次方,再将结果减3计算出的。图3-6不同峰度的分布曲线图第四章第四章 概率基础概率基础目录概率的基本概念概

    27、率的基本概念1随机变量及其分布随机变量及其分布2几种常见的概率分布几种常见的概率分布3大数定律与中心极限定理大数定律与中心极限定理4第一节概率的基本概念一、随机试验与随机事件一、随机试验与随机事件 在概率论和统计学中,我们把要研究的一个随机现象称之为一个随机试验。一个随机试验的所有可能结果的集合叫做该随机试验的样本空间,可用大写的希腊字母表示。而样本空间的任一子集合就称为一个(随机)事件 从数学角度看,这一说法不严密;但从实用角度来说,还是可行的。如果事件是由样本空间的单一元素所组成,则称为简单事件,也就是不可以再分解的事件,又称为基本事件或样本点。复杂事件则是样本空间的两个元素以上的子集,或

    28、者说由简单事件组合而成的事件。第一节概率的基本概念二、概率二、概率 如果一个随机试验在相同的条件下重复进行n次,那么,当随机事件A发生的次数是m时,就定义它发生的频率为fn(m)=m/n。(一一)古典古典(等可能等可能)概型概型(二二)概率的性质概率的性质(1)0P(A)1,P()=1。(2)记=-A(称为A的对立事件),那么P()=1-P(A),特别地,P()=0。(3)P(AB)=P(A)+P(B)-P(AB),特别地,如果事件A与事件B互不相容,则P(AB)=P(A)+P(B)。(4)如果事件A与事件B满足AB,那么P(B-A)=P(B)-P(A),从而P(B)P(A)。第一节概率的基本

    29、概念(三三)条件概率与事件的独立性条件概率与事件的独立性 在某些情况下,我们可能已经知道有关事件的一些信息,比如,已知某一事件已经发生,另一一般来说,假设A、B为两事件,P(A)0,则称P(AB)/P(A)为事件A已知条件下事件B发生的条件概率。对事件A与B,若P(AB)=P(A)P(B),则称它们是统计独立的,简称相互独立。第二节随机变量及其分布一、随机变量与概率分布的概念一、随机变量与概率分布的概念 一般来说,随机变量X是定义在样本空间=上的一个函数,这个函数的取值随着试验的结果不同而变化,并且为了能计算随机事件的概率,还要求它满足条件:对任意的实数x,Xx是随机事件,即XxF。如果随机变

    30、量所有可能的取值是有限的,或可以排成一列,这种随机变量称为离散型随机变量,如投骰子试验中出现的点数。另一种情况是随机变量的取值范围是一个区间或整个数轴,这种随机变量称为连续型随机变量 这一说法不太严密,因为还存在奇异型随机变量。这里之所以这么说,是为了简单起见。第二节随机变量及其分布二、概率分布的类型二、概率分布的类型(一一)离散型随机变量的概率分布离散型随机变量的概率分布 设离散型随机变量X的所有可能取值为x1,x2,xn,相应的概率为P(x1),P(x2),P(xn),。该概率分布也可简单记为:P(X=xi)=P(xi)(i=1,2,)第二节随机变量及其分布(二二)连续型随机变量的概率分布

    31、连续型随机变量的概率分布 设X是一个随机变量,若存在一个非负可积函数f(x),使得X的概率分布函数F(x)=P(Xx),可以表示为:F(x)=f(t)dt,-x+则称X是连续型随机变量,f(x)是它的(概率)密度函数。连续型随机变量的密度函数有以下性质:(1)f(x)0;(2)f(x)dx=1;(3)P(aXb)=f(x)dx;(4)在f(x)的连续点处,f(x)=F(x)。第二节随机变量及其分布三、随机变量的数字特征三、随机变量的数字特征(一一)随机变量的随机变量的(数学数学)期望期望 1.离散型随机变量X的数学期望值定义 E(X)=xiP(xi)2.连续型随机变量X的(数学)期望值定义 E

    32、(X)=xf(x)dx 更一般地,如果g(x)是可积函数,则随机变量X的函数Y=g(X)也是随机变量,并且其数学期望值定义为:E(Y)=Eg(X)=g(x)f(x)dx 3.随机变量数学期望的性质 E(X1+X2)=E(X1)+E(X2)其中X1,X2是随机变量,是任意常数。也就是说,随机变量的期望具有线性性质,并且这个性质可推广到多个随机变量的情形。第二节随机变量及其分布(二二)随机变量的方差与标准差随机变量的方差与标准差 方差的正平方根称为标准差。1.离散型随机变量X的方差 Var(X)=P(xi)2.连续型随机变量X的方差 Var(X)=x-E(X)2f(x)dx 3.随机变量的方差的性

    33、质(1)对于任意的常数,Var(aX)=a2Var(X)(2)Var(X)=E(X2)-E(X)2第二节随机变量及其分布四、随机向量与独立性四、随机向量与独立性(一一)二元二元(维维)随机向量随机向量我们以二元(维)随机向量为例来说明随机向量的相关概念和性质。设X,Y是随机变量,记XxYy=Xx,Yy,则F(x,y)=P(Xx,Yy)称为二元(维)随机向量(X,Y)的(联合)概率分布函数,而FX(x)=P(Xx)和FY(y)=P(Yy)分别称为X和Y的边际(边缘)分布。如果F(x,y)=FX(x)FY(y)始终成立,则称X和Y相互(统计)独立。第二节随机变量及其分布(二二)离散型随机向量的概率

    34、分布离散型随机向量的概率分布 设离散型随机向量(X,Y)的所有可能取值为(xi,yj);i,j=1,2,则随机向量(X,Y)的(联合)概率分布(列)为:pij=P(X=xi,Y=yj)(i,j=1,2,)(4.13)而 pi.=P(X=xi,Y=yj)=P(X=xi)p.j=P(X=xi,Y=yj)=P(Y=yj)分别是X,Y的边际(边缘)分布。第二节随机变量及其分布(三三)连续型随机向量的概率分布连续型随机向量的概率分布 设(X,Y)是随机向量,若存在一个非负可积函数f(x,y),使得(X,Y)的概率分布函数F(x,y)=P(Xx,Yy)可以表示为:F(x,y)=f(s,t)dtds-x,y

    35、 1,X1,X2,Xn相互独立)且服从同一分布,该分布存在有限的期望和方差E(Xi)=,Var(Xi)=2,(i=1,2,)。令Yn=(Xk-n)/,则:P(Yn5,n(P-1)5,则可以把二项分布问题转化为正态分布问题近似地去求解,根据(5.3)式和(5.4)式,有PN 即样本成数P服从期望值为、方差为(1-)的正态分布。因此,可以用Z统计量来构造总体成数的置信区间:Z=N(0,1)第三节简单随机抽样的区间估计三、两个总体均值及两个总体成数之差的置信区间三、两个总体均值及两个总体成数之差的置信区间(一一)两个总体均值之差的置信区间两个总体均值之差的置信区间 1.两个总体的方差、已知情况下的估

    36、计 2.两个总体的方差、未知情况下的估计(二二)两个总体成数之差的置信区间两个总体成数之差的置信区间 可以证明,当n1和n2都很大,而且总体成数不太接近0或1时,P1-P2的抽样分布近似服从正态分布,且:=1-2 从而1-2的置信度为(1-a)的置信区间为:(P1-P2)Z/2 但由于1、2均未知,故上述区间中的1和2需要用P1和P2代替,此时,1和2的置信度为(1-a)的近似置信区间为:(P1-P2)Z/2第三节简单随机抽样的区间估计四、样本容量的确定四、样本容量的确定(一一)估计总体均值时样本容量的确定估计总体均值时样本容量的确定 在一定的置信水平下,用样本均值估计总体均值时所允许的最大绝

    37、对误差,称为允许误差,用表示。必要样本容量n与允许误差、可靠性系数、总体标准差有以下关系:(1)总体方差越大,必要的样本容量n越大。(2)必要的样本容量n反比例于允许误差2。(3)必要的样本容量n与可靠性系数成正比。第三节简单随机抽样的区间估计(二二)估计总体成数时样本容量的确定估计总体成数时样本容量的确定 估计总体成数时,允许误差为:=Z/2 与估计总体均值时的唯一不同的是用(1-)代替2。由(5.42)式可得出估计总体成数时,确定必要样本容量的公式。第四节复杂随机抽样的区间估计一、分层抽样的估计一、分层抽样的估计 分层抽样也称为类型抽样,它是按一定标志对总体各单位进行分类,然后分别从每一类

    38、中按随机原则抽取一定的单位构成样本。分层抽样的前提是对总体的结构有一定的了解,为了充分利用这些信息、提高估计的精确度,应对总体按确定标准进行分类,保证抽出的样本与总体尽可能保持相似的结构。第四节复杂随机抽样的区间估计二、等距抽样的估计二、等距抽样的估计 等距抽样又称为机械抽样或系统抽样,它是将总体各单位按某标志进行排序,然后按固定的间隔来抽取样本单位的抽样组织形式。总体排序标志是由总体的有关辅助信息确定,与调查标志两者间可以有关也可以无关。等距抽样的间隔,应避免与现象本身的节奏性或循环周期相重合。用等距抽样方式抽取一个样本后,就可以计算样本平均数。因此,直接计算等距抽样的平均误差是有困难的,只

    39、能以间接方式计算其近似值。第四节复杂随机抽样的区间估计三、整群抽样的估计三、整群抽样的估计 整群抽样就是将总体各单位分成若干群,然后从其中随机抽取部分群,对中选的群进行全面调查的抽样组织方式。在总体单位数很大时,如果直接从总体中抽取总体单位,有时是很困难的,比如从一个大城市中的所有大学生中抽取了解大学生的基本情况,这个城市的大学生人数有几十万之多,直接抽取样本单位有许多困难,如抽样框的编制等。第四节复杂随机抽样的区间估计四、多阶段抽样的估计四、多阶段抽样的估计 所谓多阶段抽样,就是先从总体中抽出较大范围的单位,再从选的大单位中抽较小范围的单位,以此类推,最后从更小的范围抽出样本单位。这种抽样方

    40、式在我国的农产量调查、职工家计调查中常被采用,我们可以先从全国抽出各个省,再从抽中的省中抽出县、市,最后抽出样本的基本单位。第六章第六章 假设检验假设检验目录假设检验的基本原理假设检验的基本原理1总体参数假设检验总体参数假设检验2非参数检验非参数检验3第一节假设检验的基本原理一、假设检验的基本原理一、假设检验的基本原理 假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。一般来说,取0.05(5%),对于一些比较严格的情况,如在一些高精密质量检验的假设检验中,它可以取0.01或者更小。越小,所做出的拒绝原假设的判断的说服力就越强。当然,不管有多么小,也不能

    41、代表小概率事件没有发生的可能,这也正是假设检验与数学上“反证法”的不同之处。假设检验按照所检验内容的不同,可以分为参数检验和非参数检验。对已知总体分布的某个未知参数进行的检验,称为参数检验;对总体的分布形式进行的检验,则称为非参数检验。本章将分别对这两类检验进行介绍。第一节假设检验的基本原理二、假设检验的规则与两类错误二、假设检验的规则与两类错误(一一)假设检验的规则假设检验的规则(1)根据实际应用问题确定合适的原假设H0和备选假设H1;(2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;(3)给定检验的显著性水平,在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况

    42、求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;(4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。第一节假设检验的基本原理(二二)p)p值检验值检验 p值检验的原理:建立原假设后,在假定原假设成立的情况下,参照备选假设,可以计算出检验统计量超过或者小于由样本所计算出的检验统计量的数值的概率,这便是p值;而后将此p值与事先给出的显著性水平进行比较,如果p值小于,也就是说,原假设对应的为小概率事件,根据上述的“小概率原理”,我们就可以否定原假设,而接受对应的备选假设。如果p值大于,我们就不能否定原假设。(三三)两类错误两类错误 实际上依据真实总体情

    43、况,我们应该接受原假设H0,但根据样本信息,却做出拒绝H0的错误结论,这是“弃真”错误;此外,我们也可能犯这样的错误:实际的总体情况是应该拒绝原假设,而我们却接受了它,这便是“纳伪”错误。第一节假设检验的基本原理三、检验功效三、检验功效 由于为犯“纳伪”错误的可能性大小,或者说表示出现接受不真实的原假设的结论的概率,那么1-就是指出现拒绝不真实的原假设的概率。若1-的数值越接近于1,表明不真实的原假设几乎都能够被拒绝。诚然,如果1-的数值接近于0,表明犯“纳伪”错误的可能性很大。因此,1-可以用来表明所做假设检验工作好坏的一个指标,我们称为检验功效。它的数值表明我们做出正确决策的概率为1-。一

    44、个好的检验法则总是希望犯两类错误的可能性与都很小,但是这在一般场合下是很难实现的。要使得小,必然导致大;若要使小,必导致增大。第二节总体参数假设检验一、总体均值的假设检验一、总体均值的假设检验(一一)总体方差总体方差22已知已知 对于双侧检验,建立的假设为:H0=0,H10 其中,0为一个给定已知的常数。对于左(右)单侧检验来说,建立的假设为:H0=0,H1)0 根据样本资料及假设,计算出样本统计量的值z。这样,我们便可以得出原假设的拒绝域为:|z|(对双侧检验而言)zz1-(对于右单侧检验而言)当z值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。第二节总体参数假设检验(二二)总体方

    45、差总体方差22未知未知 对于双侧检验,建立的假设为:H0=0,H10 对于左(右)单侧检验来说,建立的假设为:H0=0,H1)0 只是在构造检验统计量时,不是利用z检验法。而是在原假设成立的条件下,利用t检验法,构造检验统计量:t=t(n-1)根据样本资料及假设,计算出样本统计量的值t。这样,可以得出对原假设的拒绝域为:|t|(n-1)(双侧检验)tt1-(n-1)(右单侧检验)当t值落入拒绝域时,就拒绝原假设,否则不能拒绝原假设。第二节总体参数假设检验二、两个总体均值之差的检验二、两个总体均值之差的检验(一一)两总体方差、已知两总体方差、已知(1)双侧检验。(2)左单侧检验。(3)右单侧检验

    46、。(二二)两总体方差、未知但相等两总体方差、未知但相等对于双、单侧检验,原假设都是相同的,均为H0 x=y。只是在双侧检验时,备选假设H1xy;在左单侧检验时,备选假设为H1xy。在原假设成立的情况下,根据上面的公式,可以构造如下的检验统计量:t=t(n1+n2-2)可以根据样本资料的数据,计算样本检验统计量的数值。第二节总体参数假设检验三、总体成数的假设检验三、总体成数的假设检验(一一)单样本成数检验单样本成数检验 建立假设:H0=0,H10 构建检验统计量,服从标准正态分布,即zN(0,1)。其中,P代表样本的成数,代表总体的成数。对于显著性水平,可以通过查标准正态分布表得到临界值。第二节

    47、总体参数假设检验四、正态总体方差的假设检验四、正态总体方差的假设检验 方差是反映现象在数量上变异程度的指标,反映变化的均衡程度。对于正态总体方差的检验主要有两种:一是检验总体方差是否显著等于某一给定的确定值,二是检验总体方差是否显著性地在某个给定的范围内。五、两个正态总体方差比的检验五、两个正态总体方差比的检验(一一)两总体均值两总体均值xx、yy已知已知(二二)两总体均值两总体均值xx、yy未知未知第三节非参数检验一、非参数检验概述一、非参数检验概述 前面介绍的各种假设检验都是在总体分布形式已知或者假定总体分布的前提下做出判断。但在实际问题中,可能无法获知或者不一定了解总体的分布类型,而只能

    48、通过样本来检验关于总体分布的假设。这种检验方法称为非参数检验。第三节非参数检验二、二、2检验检验(一一)分布拟合检验分布拟合检验该检验的假设为:H0F(x)=F0(x),H1F(x)F0(x)其中,F(x)为总体的分布函数,F0(x)是某个事先假定的总体分布函数。2检验的步骤为:(1)建立假设。(2)将样本资料数据值按区间进行适当的划分。(3)计算在各个样本区间内的实际频数fi(1im)。(4)调整区间。(5)构造并计算统计量。(6)计算临界值。(7)进行判断。第三节非参数检验(二二)独立性检验独立性检验顾名思义,该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间

    49、是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。列联表是多行多列纵横交错所形成的一个表体。我们以例子说明列联表的形式以及如何将独立性检验化为列联表并进行检验分析的程序。第三节非参数检验三、符号检验三、符号检验(一一)单样本的符号检验单样本的符号检验(二二)配对样本的符号检验配对样本的符号检验(三三)非配对样本的符号检验非配对样本的符号检验第三节非参数检验四、秩和检验四、秩和检验秩和检验是一种用样本秩代替样本值的检验方法,用该法可以检验两个总体的分布函数是否相等的问题。所谓秩,就是样本观测值在序列中的排序号。具体的检验步骤为:(1)建立假设

    50、。H0F1(X)=F2(X),H1F1(X)F2(X)(2)从这两个总体X、Y中分别抽取样本容量为n1、n2的两个样本,n1+n2=n。(3)计算取自总体X的样本的秩和T,即将该样本的所有样本单位的秩加总。总。第三节非参数检验五、游程检验五、游程检验 游程检验用来检验样本是否随机地取自于总体。样本所具有的某个特征的分布越无序,越无规律性,就越能说明样本的随机性。所谓游程,是指依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分。对应地,同类游程出现的次数则称为该类的游程数,通俗地讲,就是连成一片的事件或字符的片数。不同类游程数的总和,称为总游程数,记为R。第三节非参数检验六、等级相

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:配套课件-统计学1.ppt
    链接地址:https://www.163wenku.com/p-3394322.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库