书签 分享 收藏 举报 版权申诉 / 30
上传文档赚钱

类型截面数据的应用课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2928970
  • 上传时间:2022-06-12
  • 格式:PPT
  • 页数:30
  • 大小:918.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《截面数据的应用课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    截面 数据 应用 课件
    资源描述:

    1、 单变量截面数据是对同一时点(或同一时间)、同一总体内的不同单变量截面数据是对同一时点(或同一时间)、同一总体内的不同统计单位所承载的一个数量标志进行一系列观察所得到的一列数据统计单位所承载的一个数量标志进行一系列观察所得到的一列数据 特点特点 : 同一时点(或同一时间)的某种经济现象(一种标志),突出统同一时点(或同一时间)的某种经济现象(一种标志),突出统计单位的差异,按单位排列的一列(或一行)数据计单位的差异,按单位排列的一列(或一行)数据 应用:应用: 主要用于计算总量指标、结构相对指标、比较相对指标、比例相主要用于计算总量指标、结构相对指标、比较相对指标、比例相对指标、平均指标、变异

    2、指标和进行参数估计、假设检验等对指标、平均指标、变异指标和进行参数估计、假设检验等 分布特征分布特征 :n集中趋势频数分布数列中各观察值有一种向中心集中的趋势,在中心附近的观察值数目较多,而远离中心附近的观察值数目较少。n离散态势频数分布数列中各观察值各相差异,表现出偏离中心的态势。n偏态频数分布数列中各观察值分布在中心两侧不对称的程度,反映偏离正态分布的程度。n峰度频数分布数列中各观察值不均匀分布的程度,反映偏离正态分布的程度。 n计算总量指标计算总量指标,反映在一定时空条件下的社会经济现象总规模或绝对水平。计算总量指标,是认识社会经济现象总体的起点,是宏观管理的依据,是计算相对指标和平均指

    3、标的基础。n计算相对指标计算相对指标,反映现象总体在时间、空间、结构、比例以及发展状况等方面的对比关系。计算相对指标,将对比的总量指标的绝对水平及其差异抽象化,为不能直接对比的社会经济现象总体找到共同比较的基础,从而增强人们判断和鉴别纷繁复杂事物的能力。n计算平均指标计算平均指标,反映各总体单位的标志值集中趋势和标志值的一般平均水平。计算平均指标,揭示现象的依存关系,比较在同一时期同类现象在不同地区、不同单位的一般发展变化水平,用于评价总体各单位的工作质量和效果。n计算变异指标计算变异指标,反映标志值的离散程度和标志值的一般平均差异水平。计算变异指标,衡量平均指标的代表性,如果变异指标值越小,

    4、平均指标值的代表性就越大;如果变异指标值越大,平均指标值的代表性就越小。 n(一)单变量截面数据推断(一)单变量截面数据推断参数估计参数估计n 所谓参数估计就是用抽样指标来推断总体指标。点估计就是用样本指标值作为估计量来直接估计相应的总体指标值:用样本平均数估计总体平均数,用样本成数估计总体成数,用样本方差估计总体方差,等等。n 区间估计就是用样本指标值作为估计量来估计相应的总体指标的数值范围:用样本平均数估计总体平均数的置信区间,用样本成数估计总体成数的置信区间,用样本方差估计总体方差的置信区间,等等;用两个样本平均数之差估计两个总体平均数之差的置信区间,用两个样本成数之差估计两个总体成数之

    5、差的置信区间,用两个样本方差之比估计两个总体方差之比的置信区间,等等。n 所谓假设检验就是先对总体提出一个假设,再用抽样所获得的样本信息去检验这个假设是否成立。假设检验分为单样本假设检验和双样本假设检验。n 单样本假设检验就是用一个样本信息去检验总体假设:用样本平均数检验假设的总体平均数,用样本成数检验假设的总体成数,用样本方差检验假设的总体方差,等等。n 双样本假设检验就是用两个独立的样本信息去检验总体假设:在同一总体中抽取两种不同处理的两个样本,用两个样本平均数来检验其两种不同的处理是否有显著性的差异。在两个总体中分别抽取一个样本,用其样本平均数之差、样本成数之差、样本方差之比来检验两个总

    6、体是否有显著性的差异。n双变量截面数据是对同一时点(或同一时间)、同一总体内的不同统计单位的两种标志进行一系列观察所得到的数据。n双变量截面数据的特点:同一时点(或时间)的两种现象(两种标志),突出变量之间的联系。n双变量截面数据分三种类型:两个变量均为类型变量、两个变量均为数值变量、一个类型变量和一个数值变量。(一)列联表(一)列联表 当两个变量都是类型变量时,它们之间的联系可称为关联,研究关联关系的方法是列联表分析。列联表是按两种质量标志对一组观测值进行交叉分组所得到的频数分布表,表的横标目是一个质量标志的各个名称,表的纵标目是另一个质量标志的各个名称,表芯各格列出同时联系于横行某特定标志

    7、名称和纵行某特定标志的名称的观测值的频数。 【例【例14141 1】 某校随机抽查了某校随机抽查了100100个学生的概率论闭卷考试成绩,并分组:个学生的概率论闭卷考试成绩,并分组:7070分以下的分以下的4141人、人、70708080分的分的2222人、人、8080分以上的分以上的3737人,成人,成“U”U”型分布。型分布。概率论的后续课程是统计学,统计学课程是采取闭卷考试还是采取开卷概率论的后续课程是统计学,统计学课程是采取闭卷考试还是采取开卷考试,对这考试,对这100100个学生进行意愿(同意开卷考试还是同意闭卷考试)调查个学生进行意愿(同意开卷考试还是同意闭卷考试)调查结果如表结果

    8、如表14143 3。 n从上表看出,概率论考试成绩70分以下的倾向于开卷考试,80分以上的倾向于闭卷考,7079分的倾向不明显。 分组意愿70分以下 7079分 80分以上合计开卷26111350闭卷15112450合计412237100143考试意愿调查表 单位:人144144考试意愿调查结果交叉表考试意愿调查结果交叉表 单位:人单位:人 , % %分组意愿70分以下7079分80分以上行 合计开卷次数26111350行百分比522226100列百分比655035总百分比261113闭卷次数15112450行百分比302248100列百分比355065总百分比151124列合计次数41223

    9、7100总百分比412237100 如果各个行百分比与合计列百分比(或者各个列百分比与行合计百分比)基本上一致,则可以认为两变量不关联;否则,则认为两变量关联。 n若两变量存在着关联,使用一变量(自变量)推测另一变量(因变量),使得推测的盲目性降低的幅度称为关联推测指数,关联推测指数公式如下:n式中:n 表示为自变量 为因变量 的关联推测指数;n 表示观察值总数;n 表示行合计中最大值;n 表示第j列的交叉分组频数最大值。.1.max()max()max()kijjijy xiffnf. y xxynmax()ifmax()ijjf例例14142 2 某空调的型号与用途进行抽样调查如表某空调的

    10、型号与用途进行抽样调查如表14145 5,根据这个调查,根据这个调查,空调推销员推测顾客可能会买那种型号的空调。空调推销员知道顾客购空调推销员推测顾客可能会买那种型号的空调。空调推销员知道顾客购买空调的用途比不知道顾客购买空调的用途错误推测率降低了多少?买空调的用途比不知道顾客购买空调的用途错误推测率降低了多少? 表145 不同型号的空调用途调查情况表 单位:台型号 用途寝室客厅办公室合计KFR-25GW2537870KFR-35GW106253125KFR-50LW54159105合计40140120300用以上公式计算得:.1.max()max()256259 1250.12max()30

    11、0 125kijjijy xiffnf表示有“用途”这个信息比没有“用途”这个信息进行推测顾客购买空调型号的错误推测率降低了12%。 当两个变量都是数值变量时,它们之间的联当两个变量都是数值变量时,它们之间的联系称为协变。研究协变关系的方法采用相关和回系称为协变。研究协变关系的方法采用相关和回归分析的方法。相关分析和回归分析只是从数据归分析的方法。相关分析和回归分析只是从数据出发定量地分析变量间相互联系的手段,并不能出发定量地分析变量间相互联系的手段,并不能揭示现象之间的本质联系,不能仅凭数据进行相揭示现象之间的本质联系,不能仅凭数据进行相关分析和回归分析,需要结合实际经验去分析,关分析和回归

    12、分析,需要结合实际经验去分析,才能把握事物的客观规律性。才能把握事物的客观规律性。 从两种现象间的本质联系去判断现象的相关从两种现象间的本质联系去判断现象的相关性,并由实质性科学加以说明,是对现象性,并由实质性科学加以说明,是对现象“质质”的方面的研究的方面的研究定性研究。从两种现象所承载定性研究。从两种现象所承载的两列数据列判断现象的相关性,是对现象的两列数据列判断现象的相关性,是对现象“量量”的方面的研究的方面的研究定量研究定量研究 定量研究定性研究无相关性有相关性无相关性没有相关性没有相关性,数据出现巧合有可能没有认识到它们的相关性有相关性有相关性,但不是线性相关有相关性,但没有因果关系

    13、、或分不清因果、或互为因果有相关性,有因果关系(直线型或曲线型)n以 为横轴 、以 为纵轴建立直角坐标系,把两变量用坐标内的点来表示,根据点的分布情况可直观明了地看出两变量之间的关系。n因此,通过作散点图辨别两变量的相关性。先将两变量作散点图,然后将坐标原点移到点 ,建立新坐标系 ,在新坐标系中看点的分布情况 xy( , )o x yy o x 点主要分布在新坐标系的一、三象限内, 的协方差两变量呈正相关。两变量 呈正相关。()(), )0 xxyyx yncov(xy与xy与n点主要分布在新坐标系的二、四象限内, 的协方差n两变量 呈负相关。xy与xy与()(), )0 xxyyx ynco

    14、v(点主要呈曲线型分布,两变量呈曲线相关。n点一、三象限的分布与二四象限的分布相等,n 的协方差n两变量 没有相关性。xy与()(), )0 xxyyx yncov(xy与n 用定性分析的方法确定两种现象的因果关系:如果有用定性分析的方法确定两种现象的因果关系:如果有因果关系(因果关系不能颠倒),这两种现象所承载的数因果关系(因果关系不能颠倒),这两种现象所承载的数量对应关系可直接模拟回归方程来表示;如果没有因果关量对应关系可直接模拟回归方程来表示;如果没有因果关系(分不清因果关系或互为因果关系),根据研究的目的系(分不清因果关系或互为因果关系),根据研究的目的确定因果关系,再模拟回归方程来表

    15、示这两种现象所承载确定因果关系,再模拟回归方程来表示这两种现象所承载的数量对应关系。的数量对应关系。n以 表示自变量(横轴)、以 表示因变量(纵轴)建立直角坐标系,把两变量用坐标内的点来表示(作散点图),根据点的分布规律判断两变量之间的回归关系类型。 xyn一元直线回归模型 的模拟。n用Excel求人均存款( )与人均零售额( )直线回归参数 和 ykxbxykbn 研究一个类型变量对一个数值变量的影响用单方差分析方法。比如第十一章中,油菜品种是类型变量,油菜单产是数值变量,研究油菜品种的变化对油菜单产量的影响,用单方差分析方法。这种方法多用于试验设计,类型变量是可控变量,数值变量是随机变量,

    16、从类型变量出发来研究不同类型对实验指标影响的差异 n 多变量截面数据是对同一时点(或同一时间)、同一总体内的不同统计单位所承载的多个(三个或三个以上)数量标志进行一系列观察所得到的多组(三组或三组以上)数据。n 特点:n 同一时点(或时间)的多种现象(三个或三个以上指标),突出变量之间的联系,按单位排列的多列(或多行)数据 n研究一个变量与多个变量关系的表达式,用多元回归分析。n 研究多变量时,变量之间有一定的相关关系,信息有一定的重叠。为了剔除重叠信息,建立尽可能少的、互不相关的新变量来替代原变量。这些新变量就是主成分。主成分可表示成原变量的线性组合。在P个原变量所作的线性组合中,选取包含信

    17、息最多的、有最大解释变异能力的线性组合为第一主成分。如果第一主成分不足以代表原来P个变量的信息,再考虑选第二个线性组合,依此类推可以构造出第三、第四第P个主成分。而实际只选取解释能力达到80%以上的m个主成分(mp)。n式中: 表示第 个主成分, n 表示第 个主成分 与第 n 个原变量 之间的相关系数, 表示第 个原变量 11111221221122221122ppppppppppyu xu xuxyuxuxuxyuxuxuxiyix(1,2)iy ipi(1,2, ;1,2, )iju ip jpiiyjjxjx(j=1,2,p)jn1、将原始数据标准化,以剔除变量间在数量级和量纲上的不同

    18、。n2、求标准化数据的相关系数矩阵。n3、求相关矩阵的特征值和特征向量。n4、计算方差贡献率和累积方差贡献率:第个特征值占特征值之和的百分比代表原始数据总信息量的百分比,称为主成分的方差贡献率(用表示)。将方差贡献率由大到小排序、由大到小进行累积。n5、确定主成分。将特征值由大到小排序,选取前m个特征值(前m个累积方差贡献率大于80%)。n6、计算主成分得分。以选取的特征值所对应的特征向量( )作原变量的线性组合n (144)n 主成分的经济意义由各线性组合中权数较大的变量的综合意义来确定。n7、综合得分n以所选主成分的方差贡献率 为权,将其线性组合得到综合评价 n n (145)n8、得分排序。利用总分可以得到得分名次。12,iiipuuu1 122iiiippyu xu xu x(0)im (1,2,)iim112212mmmyyyy

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:截面数据的应用课件.ppt
    链接地址:https://www.163wenku.com/p-2928970.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库