医学信息学论文SPSS分类树应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学信息学论文SPSS分类树应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 信息学 论文 SPSS 分类 应用 课件
- 资源描述:
-
1、SPSS Classification Trees 分类树的应用分类树的应用深圳市医学信息中心深圳市医学信息中心罗春花罗春花内容内容基本概念基本概念快速入门快速入门知识拓展知识拓展一、基本概念一、基本概念什么是分类树?什么是分类树?对资料的要求对资料的要求用途用途如何确定变量的重要性、相互关系、交如何确定变量的重要性、相互关系、交互作用互作用分类树的优缺点分类树的优缺点分类树的运算法则分类树的运算法则1.什么是分类树?什么是分类树?分类树产生一个基于树状的分类模型;分类树产生一个基于树状的分类模型;它将研究对象分组,可以根据自变量预它将研究对象分组,可以根据自变量预测因变量;是探索性和证实性分
2、类分析测因变量;是探索性和证实性分类分析的有效工具。的有效工具。2.对资料的要求:任何类型对资料的要求:任何类型不要求解释变量不要求解释变量Xi 和结果变量和结果变量Y具有某种特具有某种特定的分布。定的分布。允许不同数据类型的解释变量一起进入模允许不同数据类型的解释变量一起进入模型,可以使用不同数据类型的结果变量。型,可以使用不同数据类型的结果变量。传统方法对资料的类型和分布有相对严格传统方法对资料的类型和分布有相对严格的规定(如多元线性回归);不易处理共的规定(如多元线性回归);不易处理共线性问题和多水平变量之间复杂的交互作线性问题和多水平变量之间复杂的交互作用(如用(如logistic 回
3、归)。回归)。根据解释变量对结果变量进行分类和根据解释变量对结果变量进行分类和预测。预测。识别影响因素间的交互作用识别影响因素间的交互作用3.用途用途1352名少年儿童肥胖症危险因素名少年儿童肥胖症危险因素儿童肥胖症的儿童肥胖症的高危人群和低危人群高危人群和低危人群4.变量的重要性及变量的重要性及变量间的相互关系如何确定?变量间的相互关系如何确定?解释变量的重要性表现为该解释变量解释变量的重要性表现为该解释变量出出现在树干的起始部位,或离起始部位很现在树干的起始部位,或离起始部位很接近接近;另一方面,重要性还表现为同一;另一方面,重要性还表现为同一解释变量解释变量多次在模型中出现多次在模型中出
4、现。利用解释变量之间上下的关系分析解释利用解释变量之间上下的关系分析解释变量间是否有可能存在交互作用。如果变量间是否有可能存在交互作用。如果某些解释变量在单因素分析时与结果变某些解释变量在单因素分析时与结果变量之间无明显关联,而在模型中的某些量之间无明显关联,而在模型中的某些局部有明显的效应,提示这些解释变量局部有明显的效应,提示这些解释变量之间可能存在交互作用。之间可能存在交互作用。5.分类树的优缺点分类树的优缺点是一种新的多因素分析方法,其结果直是一种新的多因素分析方法,其结果直观、明了、易于解释,能有效处理缺失观、明了、易于解释,能有效处理缺失数据及变量之间的共线性,对资料分布数据及变量
5、之间的共线性,对资料分布无任何要求。无任何要求。只适合大样本资料。如果结果变量是连只适合大样本资料。如果结果变量是连续性资料,样本含量可以小一些。如果续性资料,样本含量可以小一些。如果结果变量是分类资料,样本含量要大。结果变量是分类资料,样本含量要大。6.运算法则运算法则 CHAID 结果变量:分类资料(最常结果变量:分类资料(最常用)用)、计量或等级资料、计量或等级资料Exhaustive CHAID:结果变量:分类资结果变量:分类资料(最常用)料(最常用)、计量或等级资料、计量或等级资料CRT结果变量:计量资料(最常用)、结果变量:计量资料(最常用)、分类或等级资料分类或等级资料QUEST
6、 结果变量:仅用于分类资料结果变量:仅用于分类资料二、快速入门二、快速入门 Quick Start1352名少年儿童肥胖症危险因素名少年儿童肥胖症危险因素银行对客户的信贷风险评估银行对客户的信贷风险评估学生压力的影响因素分析学生压力的影响因素分析(一)结果变量是分类资料(一)结果变量是分类资料 例例1 1352名少年儿童肥胖症危险因素名少年儿童肥胖症危险因素性别:男、女性别:男、女年龄组:年龄组:7-9岁,岁,10-12岁,岁,13-15岁,岁,16岁岁胆固醇:胆固醇:5.18(mmol/L),5.18(mmol/L)甘油三脂:甘油三脂:0.50(mmol/L),0.50(mmol/L)1.数
7、据文件数据文件2.SPSS过程过程单击单击OK(不必在此定义变量属性)(不必在此定义变量属性)右键单击变量,定义变量类型右键单击变量,定义变量类型定义数据测量类型定义数据测量类型Measure计数资料:计数资料:Nominal等级资料:等级资料:Ordinal计量资料:计量资料:Scale定义变量定义变量“性别性别”Nominal定义变量定义变量“年龄组年龄组”Ordinal定义变量定义变量“胆固醇胆固醇”Nominal定义变量定义变量“甘油三脂甘油三脂”Nominal 定义变量定义变量“肥胖症肥胖症”Nominal肥胖症肥胖症Dependent Variable性别、年龄组、胆固醇、甘油三脂
8、性别、年龄组、胆固醇、甘油三脂 Independent VariableGrowing Method Exhaustive CHAID单击单击OK3.主要结果主要结果例例2 2 银行对客户的信贷风险评估银行对客户的信贷风险评估A bank wants to categorize credit applicants according to whether or not they represent a reasonable credit risk.Based on various factors,including the known credit ratings of past custom
9、ers,you can build a model to predict if future customers are likely to default on their loans.1.数据文件数据文件2.To Obtain Classification TreesAnalyzeClassify Tree.3.Define Variable Properties定义数据测量类型定义数据测量类型Measure计数资料:计数资料:Nominal等级资料:等级资料:Ordinal计量资料:计量资料:ScaleClassification Tree dialog boxDefine Variab
10、le Properties可对变量设置变量值标签可对变量设置变量值标签可更改变量类型和设置变量值标签可更改变量类型和设置变量值标签单击单击OK4.分类树分类树主主对话框对话框(1)Selecting CategoriesGrowing Method:CHAID(2)Force the first variable Influence variable 一般不选择这一般不选择这2项项(3)Validation 是否需要交叉核实和是否需要交叉核实和分开分开2样本核实?样本核实?默认:不需要默认:不需要 (4)CriteriaGrowth Limits、CHAID、IntervalsTree Dep
11、th:AutomaticParent Node:400;Child Node:200CriteriaCHAID,默认拆分及合并的检验水准均定位拆分及合并的检验水准均定位0.05CriteriaIntervals,对连续性变量,默认分为10个区间(5)Output treeTree in table format:非默认,可不选非默认,可不选Output StatisticsOutput Plots5.主要结果主要结果CHAID,Exhaustive CHAIDModel Summary:记录了主要操作:记录了主要操作Model SummaryCHAIDCredit ratingAge,Inco
12、me level,Number of credit cards,Education,Car loansNONE3400200Income level,Number of credit cards,Age1063Growing MethodDependent VariableIndependent VariablesValidationMaximum Tree DepthMinimum Cases inParent NodeMinimum Cases inChild NodeSpecificationsIndependent VariablesIncludedNumber of NodesNum
13、ber of TerminalNodesDepthResultsTree Editor改变图形方向改变图形方向增大图形增大图形单击单击“”或右键或右键隐蔽子结隐蔽子结Hide ChildrenTree Table(非默认,可不选)(非默认,可不选)Tree Table102041.4%144458.6%2464100.0%Good45482.1%9917.9%55322.4%Bad0Incomelevel.000662.4572 Medium42256.7%32243.3%74430.2%Bad2Number ofcreditcards.000193.11315 or more5413.8%3
展开阅读全文