《社会统计分析方法(第二版)》课件第六章 logistic回归.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《社会统计分析方法(第二版)》课件第六章 logistic回归.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会统计分析方法第二版 社会统计分析方法第二版课件第六章 logistic回归 社会 统计分析 方法 第二 课件 第六 logistic 回归
- 资源描述:
-
1、第六章 LOGISTIC回归知识链接 逻辑斯蒂(logistic)回归深入理解、阐述与实现 https:/ 线性回归分析在社会科学中已经得到广泛应用,成为标准的统计工具。作为多元分析,它能够纳入多个自变量,对社会现象提供较深入的解释力。同时,它的计算机软件现在已广为可得,它的统计结果又可以比较直观地得到解释。线性回归的确具有许多良好的统计性质,甚至在应用中的一些必要的假设条件不能完全满足时,它也仍然可以得到不失为合理的结果。二、从线性回归到logistic回归 根据实际研究的需要而不断对线性回归进行改造和发展促使了logistic回归的产生。线性回归不适用于因变量为定性变量的场合,本节通过这一
2、发展过程来介绍logistic回归克服了线性回归的缺陷,以服务于对定性因变量的多元分析。同时,也介绍了logistic回归的一般原理及其具有的性质。多元线性回归不能应用于定性因变量分析,主要是由于以下两个主要方面。(一)线性回归使用定性因变量严重违反本身假定 首先,线性回归属于一般最小二乘法一族的统计分析。这种方法通常要求变量,尤其是因变量,在间距测度等级以上,也就是平常所说的连续变量。它还要求自变量之间不能完全相关,这是回归能够求解的前提。此外,它还需要一系列其他假定条件,其中特别是关于误差项犲的假定。(二)线性概率模型及其问题 当因变量只能取值和,并作为事件发生与不发生两种情况来理解时,和
3、都是线性概率模型。“线性”指模型中假设自变量对因变量的作用是线性的;“概率”则是指将模型的因变量估计值理解为发生概率,根据观测数据中事件发生和不发生的案例数量来估计。这样一来,回归模型就是在分析当自变量变化时概率p是如何变化的。这时,解释不同自变量值所产生的因变量估计却存在很大问题。三、logistic回归模型的建立 上一节说明,如果我们错误地认定模型是线性的,那么在线性假设下导出的统计性质一般来说不能成立。其次,还有许多原因导致假设概率与自变量为线性关系在很多场合并不实用。以非线性概率模型来代替线性概率模型能够解决这些问题。(一)logistic函数及其性质(二)logistic回归模型因变
4、量的不同形式四、logistic回归系数的意义 由于logistic回归中的因变量本来是表示事件发生或不发生的虚拟变量(即、编码),只代表结果上的不同类别,不具备尺度信息,因此logistic回归系数也就不具有确定尺度信息。也就是说,logistic回归系数提供的是自变量影响的相对幅度,而不是绝对幅度。logistic回归系数的理解和阐释可以从下面两个方面来进行。(一)以logit(p)方程的线性表达式来解释回归系数 方程(p)bx与一般的多元线性回归方程在形式上相同,是线性表达式。方程右侧各项自变量的作用体现在回归系数犫犻上。各自变量的总影响是由常数项与各项自变量及相应偏回归系数之积的迭加形
5、成的。这种形式使得我们能够以类似常规多元线性回归方程的形式来理解和阐释它。(二)以发生比的指数表达式来解释回归系数 与(p)不同,发生比具有一定的实际意义,它代表一种相对风险。这一概念在博弈时使用较多。因此,对logistic回归系数的解释通常是从以发生比的指数表达式出发的。(三)几种特殊情况的讨论 自变量为虚拟变量 交互效应的分析 非线性关系的分析(四)标准化的logistic回归系数 与常规回归类似,由于自变量所取单位不同,非标准化的logistic回归系数不能用于比较各自变量相对作用,只有经过标准化后的logistic回归系数才能用来进行自变量之间的比较。但是,标准化的logistic回
6、归系数的计算方法与常规回归中标准化系数的计算方法不同,并且存在几种不同口径。五、logistic模型的整体评价和检验(一)对于整体模型的评价 人们希望了解logistic回归模型的拟合情况或解释能力,统计学家也提出了许多伪确定系指标作为近似量度。这些伪确定系数的建构思路基本一致,都是根据模型拟合的似然函数值来反映拟合情况。(二)对于整体模型的检验 我们在评价或检验一个含有自变量的logistic回归模型时,通常是将其与截距模型相比较,两者构成嵌套模型。所谓截距模型,就是将所有自变量删除后只剩一个截距系数的模型。以截距模型作为标准,检查加入其他自变量后的模型在数据拟合水平上是否显著提高。换句话说
展开阅读全文