书签 分享 收藏 举报 版权申诉 / 54
上传文档赚钱

类型社会统计学重点章节讲义课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4205929
  • 上传时间:2022-11-19
  • 格式:PPT
  • 页数:54
  • 大小:972.04KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《社会统计学重点章节讲义课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    社会 统计学 重点 章节 讲义 课件
    资源描述:

    1、社会统计学重点章节讲义社会统计学重点章节讲义 2013年考前辅导年考前辅导2.1 2.1 变量的类型变量的类型定类变量定类变量定序变量定序变量定距定距/比变量比变量2.1 2.1 变量的类型变量的类型级别测量等级变量类别统计内容性质低高名称级定类变量频数、交互等定性型(非数值型)离散型顺序级定序变量比较大小、强弱、差值无意义定量型(数值型)离散型连续型间隔级定距变量比较大小、顺序及差值比例级定比变量零点有意义2.2 2.2 样本分布样本分布 描述样本分布:概括而非具体描述 图表:频数表 条形图 直方图 统计量:分布的中心 分布的形状 职 业频次比例(%)公司职员90345.2公务员1115.6

    2、个体户/自营职业者1658.3专职家庭主妇24712.4学生23811.9合计20001002.2 2.2 样本分布样本分布 原始数据2.2 2.2 样本分布样本分布 频数表 职 业频次比例(%)公司职员90345.2公务员1115.6个体户/自营职业者1658.3专业技术人员(医生/律师等)1185.9专职家庭主妇24712.4学生23811.9其他21810.9合计20001002.2 2.2 样本分布样本分布 条形图(离散型变量)2.2 2.2 样本分布样本分布 折线图(离散型变量)2.2 2.2 样本分布样本分布 直方图(连续型变量)2.2 2.2 样本分布样本分布 曲线图(连续型变量

    3、)2.2 2.2 样本分布样本分布频数频数/相相对频率对频率全面直观描述全面直观描述概括抽象描述概括抽象描述分布的中心分布的中心分布的形状分布的形状众数众数中位数中位数均值均值极差极差四分位数差四分位数差标准差标准差调查中最常用的统计量是调查中最常用的统计量是均值均值和和标准差标准差均值均值和和标准差标准差分别是样本的分别是样本的一阶矩一阶矩和和二阶矩二阶矩定距定距/定比定比定距定距/定比定比定类定类定序定序定序定序定距定距/定比定比2.2 2.2 样本分布样本分布 计算百分位数(中位数/四分位数)原始数据:例:一个n=9的身高样本163,170,176,150,168,171,170,181

    4、,179按大小顺序重新排列:150,163,168,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。n=8150,163,168,170,171,176,179,181中位数:第25百分位数为绿色数字的中位数,第75百分位数为蓝色数字的中位数。1705 X 5.1702171170254 XX2.2 2.2 样本分布样本分布 分组数据:分组数据:组中值估算 精确计算30%20%151 157 163 1692%6%22%32%75.1696323050166 中中位位数数2.2 2.2 样本分布样本分布 计算均值、标准差计算均值

    5、、标准差原始数据分组数据 注意分母n为样本数而非分组数 自由度自由度 信息的个数2.3 2.3 概率分布概率分布 概率的定义和性质概率的定义和性质 概率是随着样本量n越来越大时相对频率的(统计意义下的)极限。所有概率之和等于1 0P(A)1 概率分布概率分布/总体分布总体分布总体矩:总体均值、总体标准差离散型变量:二项分布连续型变量:正态分布(大样本时离散变量近似适用)2.3 2.3 概率分布概率分布标准正态分布标准正态分布XZPrPr(Z1.64)=0.05(Z1.64)=0.05PrPr(Z1.96)=0.025(Z1.96)=0.025学习重点学习重点 抽样调查的原理和方法 描述性统计

    6、推断性统计推断性统计抽样分布抽样分布参数估计参数估计假设检验假设检验 群体间的差异性检验 变量间的关联性分析3.1 3.1 抽样分布抽样分布 蒙特卡罗法3.1 3.1 抽样分布抽样分布连续型变量连续型变量样本分布样本分布概率概率/总体分布总体分布抽样分布抽样分布 )(XnfX )1()(22nfXXS )(XXP )()(22XPX XnSE 直方图直方图条形图条形图正态分布正态分布正态近似定理正态近似定理标准正态分布标准正态分布1,0 n越大越大,波动越小波动越小3.1 3.1 抽样分布抽样分布离散型、连续型变量离散型、连续型变量样本比例分布样本比例分布总体比例分布总体比例分布抽样比例分抽样

    7、比例分布布nfP 相对频率相对频率 概率概率)1(PnSE)1(条形图条形图二项分布二项分布正态近似定理正态近似定理标准正态分布标准正态分布knkknrCkXP )1()(n越大越大,波动越小波动越小3.1 3.1 抽样分布抽样分布 示例:总体 1 2 3 4 5 6 7 8 9 10抽取2个样本:1.5 均值9.5抽取3个样本:2 均值9抽取4个样本:2.5 均值8.5抽取5个样本:3 均值8 正态近似定理:在容量为n的非常简单随机样本中,样本均值 以 的标准误差(为总体标准差)围绕着总体均值波动。随着n的增大,的分布也就围绕其目标波动得越来越小,它也就越来越接近于正态(铃状)。总体数的大小

    8、N对 的波动没有影响 无论总体是否呈正态分布,样本的均值分布都接近正态Xn X随着样本增大,波动越来越小。X3.2 3.2 参数估计参数估计 点估计:均值、比例 区间估计:置信区间 X PnZX 2 nPpZP)1(2 3.2 3.2 参数估计参数估计置信区间置信区间注意:注意:此处为抽样分布而此处为抽样分布而非样本分布。非样本分布。XZSEXZ 案例案例估计当前市场容量估计当前市场容量 B1 在过去的三个月里,您家是否使用了纯水?1 是,使用了2 没有,没有使用 B1:过去三个月里使用纯水的家庭比例P,据此估计总体比例的95%置信区间:nPPP)1(96.1 案例案例估计当前市场容量估计当前

    9、市场容量 B2 在过去的三个月里,您家使用了多少桶纯水?B2:月平均用水量 ,并据此估计总体平均用水量的95%置信区间:XnsX96.1 大样本时,t值与Z值近似,故用此公式。案例案例估计当前市场容量估计当前市场容量 估算总量:纯水家庭用户数量(户)总户数家庭用户总体比例 家庭月用水总量(桶)=家庭用户总体平均月用水量(桶)纯水家庭用户数量(户)已知:4个城区总户数:327,314户案例案例估计当前市场容量估计当前市场容量 统计结果:用户规模样本比例总体比例用户总数(户)8.3%6.4%10.2%20,94833,386月用水量样本均值总体均值月总用水量(桶)3.262.553.9768,29

    10、1108,8393.3 3.3 假设检验假设检验 假设检验是定量研究的基本思想假设检验是定量研究的基本思想 原假设(H0):0假设,无差异,不相关等备选假设(H1):大于、小于、不等于、有差异、有相关性等 思想依据思想依据 小概率事件原理:小概率事件在一次试验中是几乎不可能发生的3.3 3.3 假设检验假设检验 假设检验的几种方法 置信区间:设定 计算置信区间检验 参数检验:Z检验、t检验、F检验、卡方检验计算检验 经典假设检验:设定 计算临界域检验第一类错误、第二类错误)小小和和实实际际观观测测值值那那么么大大多多至至少少到到小小样样本本统统计计量量大大为为真真如如果果(单单侧侧概概值值)(

    11、)()(,0HPr 3.3 3.3 假设检验假设检验 利用置信区间进行假设检验 两个总体均值之差的置信区间估算公式:总体方差 已知但不相等时:总体方差 已知且相等时:22212122121)(nnZXX 212212111)(nnZXX 3.3 3.3 假设检验假设检验两个总体比例之差的置信区间估算公式两个总体比例之差的置信区间估算公式(大样本公式大样本公式):22211122121)1()1()(nppnppZpp 3.3 3.3 假设检验假设检验 概值)小小和和实实际际观观测测值值那那么么大大多多至至少少到到小小样样本本统统计计量量大大为为真真如如果果(单单侧侧概概值值)()()(,0HP

    12、r 学习重点学习重点 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验群体间的差异性检验 差异性检验的基本方法差异性检验的基本方法 方差分析方差分析 变量间的关联性分析4.1 4.1 差异性检验的基本方法差异性检验的基本方法 单一样本单一样本检验:检验:置信区间t检验概值 两个独立两个独立/配对样本检验:配对样本检验:置信区间t检验概值 多个样本:多个样本:方差分析:F检验概值 t t、F F越大,概值越小,越大,概值越小,H H0 0越不可信。越不可信。标标准准误误差差原原假假设设的的值值估估计计值值 t4.2 4.2 方差分析方差分析 统计量:F比值 F的取值情况:如果为真

    13、,则F比值将围绕1波动;如果不真,则F比值将倾向于大于1,而且F比值越大,原假设就越不可信。)()(不不可可解解释释的的方方差差组组内内变变差差可可以以解解释释的的方方差差组组间间变变差差 F4.2 4.2 方差分析方差分析案例:过去三月平均每户用水量案例:过去三月平均每户用水量 单一样本单一样本t t检验检验 H0:6桶;H1:9.08桶检验值=6tdf双侧概值平均差异差值的95%置信区间下限上限用了多少桶水2.6650.0123.080.715.44概值小于概值小于0.05,可以在,可以在95%置信度下拒绝原假设。置信度下拒绝原假设。案例:过去三月平均每户用水量案例:过去三月平均每户用水量

    14、 两个两个独立样本独立样本t t检验检验全家平均月收入2000以下者:9.49桶全家平均月收入2000以上者:8.19桶 假设:H0:低收入家庭高收入家庭=0H1:低收入家庭高收入家庭=1.3 检验:置信区间:-3.8066.403t=0.508;双侧概值=0.6130.05 结论:无法在95%置信度下拒绝原假设,低收入家庭与高收入家庭用水量无显著差异案例:方差分析案例:方差分析变量地区样本量均值标准差95%置信区间最小值最大值下限上限提前消费水平中国5000.72221.5125570.58930.8551108.879韩国5001.457181.793791.299571.6147908.

    15、399日本5001.38961.9984911.2141.5652011.999台湾5002.685841.9900182.510982.86069011.999变差来源变差自由度方差F比值概值组间变差1004.4833334.82899.5060.000组内变差6716.36519963.365总变差7720.8481999学习重点学习重点 抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析变量间的关联性分析 回归分析回归分析 相关分析相关分析 两个定类变量两个定类变量交互分析交互分析 两个定距变量两个定距变量简单积距相关简单积距相关5.1 5.1 回归分析

    16、回归分析 在回归分析中,斜率b的意义是X有一个单位的变化时Y伴随着发生的变化量。要使的估计更加准确,研究者可以控制的方法主要有:-减小总体标准差-增加样本量-增加样本的标准差Sx,即加大X的变化范围 哑变量当自变量为定类变量时,需要引入哑变量(0-1变量)将数据转化为数量型变量,进一步分析,哑变量的个数为(变量类型-1)5.1 5.1 回归分析回归分析 估计总体回归直线 总体斜率的估计与检验:置信区间 t检验:F检验:XY 22xStb 0:0 H 2xSbt不不能能解解释释的的方方差差可可以以由由回回归归解解释释的的方方差差 F5.1 5.1 回归分析回归分析 回归模型拟合效果评价:决定系数

    17、:的的总总变变差差差差的的可可以以由由回回归归解解释释的的方方YYr 2102 rr2=0回归的效果等于零或Y的变差中可被回归解释的比例为0;r2=1拟合的回归模型解释了Y中100%的变差。5.2 5.2 简单积距相关简单积距相关 皮尔逊相关系数r=1:两个变量有完全正向的线性联系r=-1:两个变量有完全负向的线性联系r=0:两个变量没有线性联系 总体相关系数的检验置信区间(图解法)t检验11 r0:;0 Hr案例:过去用水量与今后用水量案例:过去用水量与今后用水量相 关 分 析1.382*.0036658.382*1.003.5858皮尔逊相关系数双侧概值样本数皮尔逊相关系数双侧概值样本数过

    18、去三个月用了多少桶?今年夏季您家大概每月要用多少桶纯水?过去三个月用了多少桶?今年夏季您家大概每月要用多少桶纯水?以0.01的错误水平(双侧)检验相关性。*.回归与相关回归与相关 相关与回归:维度维度相关相关回归回归平等回归子响应X、Y都为随机变量Y为随机变量相对较少更广泛5.3 5.3 交互分析交互分析 适用情形:两个定类变量的关联性 检验方法:卡方 检验 卡方检验的局限性以及可能的补救办法 2 案例:使用纯水与家庭收入范围案例:使用纯水与家庭收入范围过 去 三 个 月 是 否 使 用 纯 水 *全 家 平 均 月 收 入 交 互 分 析11529156661.3%4.9%9.9%17.2%

    19、18.8%8.3%78290265722673198.7%95.1%90.1%82.8%81.3%91.7%793052948732797100%100%100.0%100.0%100%100%样本数%相对于全家平均月收入样本数%相对于全家平均月收入样本数%相对于全家平均月收入是否过去三个月是否使用纯水合计3000全家平均月收入的大概范围合计案例:使用纯水与家庭收入案例:使用纯水与家庭收入卡方检验24.44424.4444 4.000.00024.61524.6154 4.000.00023.65723.6571 1.000.000797797皮尔逊卡方似然比卡方线性相关卡方有效样本量值dfd

    20、f双侧概值总结总结 考试重点:抽样调查的原理和方法 描述性统计 推断性统计 群体间的差异性检验 变量间的关联性分析总结总结 统计思维:样本量越大越好?如何对现象做一个严谨的判断?实证研究基本思想:假设检验 社会现象的观察视角:群体间的差异变量间的关系 具体现象(变量)具体分析谢谢大家!谢谢大家!1、字体安装与设置、字体安装与设置如果您对PPT模板中的字体风格不满意,可进行批量替换,一次性更改各页面字体。在“开始”选项卡中,点击“替换”按钮右侧箭头,选择“替换字体”。(如下图)在图“替换”下拉列表中选择要更改字体。(如下图)在“替换为”下拉列表中选择替换字体。点击“替换”按钮,完成。2、替换模板中的图片、替换模板中的图片模板中的图片展示页面,您可以根据需要替换这些图片,下面介绍两种替换方法。方法一:更改图片方法一:更改图片选中模版中的图片(有些图片与其他对象进行了组合,选择时一定要选中图片 本身,而不是组合)。1.单击鼠标右键,选择“更改图片”,选择要替换的图片。(如下图)赠送精美图标

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:社会统计学重点章节讲义课件.ppt
    链接地址:https://www.163wenku.com/p-4205929.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库