数据分析师CPDA复习主观题参考资料课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据分析师CPDA复习主观题参考资料课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 CPDA 复习 主观题 参考资料 课件
- 资源描述:
-
1、 复习大题中国商业联合会数据分析专业委员会数据分析师认证培训课程 1中国商业联合会数据分析专业委员会主观题1一元回归复习题:主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图-计算相关系数ExcelDatahoop相关系数的值介于-1与+1之间,即-1r+1。当r0时,表示两变量正相关,当r0时,表示两变量为负相关。当|r|=1时,表示 两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两
2、变量间无线性相关关系。r仅仅是x与y 之间线性关系的一个度量,它不能用于描述非线性关系。r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。当r0.8时,可视为高度相关;当0.5r0.8时,可视为中度相关;当0.3r0.5时,视为低度相关;当r0.3时,说明两个变量之间的相关程度极弱。人均人均GDP与人均消费水平间的相关系数为与人均消费水平间的相关系数为0.998,说明两者间存在强烈的正相关关系。,说明两者间存在强烈的正相关关系。主观题1一元回归复习题:(2)人均GDP作自变量,人均消费水平作因变量,求出估计的回归方程,并解释回归系数的实际意义;Excel:xy309.
3、0693.734利用系数表中的结果,回归方程为利用系数表中的结果,回归方程为 ,其含义是人均,其含义是人均GDP每增加每增加1元,人均消费水平增加元,人均消费水平增加0.309元。元。主观题1一元回归复习题:(3)计算判定系数,并解释其意义;R2:判定系数/拟合优度(Y的总变动由X带来的有多少)Excel:判定系数是判定系数是0.996,说明方程解释人均消费,说明方程解释人均消费水平变化的水平变化的99.6%可以由人均可以由人均GDP的变化来的变化来解释。解释。主观题1一元回归复习题:(4)检验回归方程线性关系的显著性(a=0.05);F检验:回归线性关系检验(P值)T检验:回归系数检验(X对
4、y的影响)小于拒绝,大于不拒绝:原假设,假设Excel:系数表中的系数表中的Sig./P-value值值a,说明回,说明回归方程的线性关系显著性。归方程的线性关系显著性。主观题1一元回归复习题:(5)如果某地区的人均GDP为5000元,预测其人均消费水平;步骤:预测分析Excel输入公式得出结果人均人均GDP为为5000元时,人均消费水平为元时,人均消费水平为2278.107元元主观题1一元回归复习题:(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。人均消费水平人均消费水平95%的置信区间为的置信区间为1990.749,2565.464和预测区间为和预测区间为1580
5、.463,2975.75。主观题2多元回归复习题:主观题2多元回归复习题:分析主观题2多元回归复习题:分析R2:判定系数/拟合优度(Y的总变动由X1、X2、X3带来的有多少,每增加一个变量,不管相不相关,拟合优度就会提高,因此要调整拟合优度)F检验:回归线性关系检验(概率P值/sig)原假设H0:所有系数都为0 H1:至少一个不为0T检验:回归系数检验(X1、X2、X3对y的各自影响)多重共线性-主观题2多元回归复习题:分析 主观题2多元回归复习题:分析去掉X1主观题2多元回归复习题:分析单独X2单独X3主观题2多元回归复习题:分析 销售价格的预测值以及销售价格的预测值以及95%的置信区间和预
6、测区间见上表。的置信区间和预测区间见上表。回归方程为回归方程为21163.0961.0653.11xxy去掉的原则之一:模型对数据较好的拟合,如果去掉后拟合数据差异较大就不合适去掉主观题3哑变量回归复习题:主观题3哑变量回归分析:回归方程为回归方程为 y=732.06+111.22x1+458.68x2男性职工的平均月薪是男性职工的平均月薪是732.06+458.68=1191,女性职工的平均月薪是,女性职工的平均月薪是732.06,男性职工的平均月薪与女性职工的平均月薪之间的差值是男性职工的平均月薪与女性职工的平均月薪之间的差值是 458.68。工龄每增加工龄每增加1年,男性或女性月薪的平均
7、增加值年,男性或女性月薪的平均增加值111.22。主观题4 已知某厂家的产量和生产费用数据,如下表,请根据生产费用和产量数据进行如下分析:(所有结果保留两位小数)(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。(2)根据回归分析结果,写出判定系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2)(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。主观题4(1)请用生产费用作为因变量(Y),产量作为自变量
展开阅读全文