数据模型与决策讲义1课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据模型与决策讲义1课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 决策 讲义 课件
- 资源描述:
-
1、2022-7-211第1章 总论v一、数据分析的意义v1、定量方法类课程在工商管理中的地位管理专业知识体系专业理论专业工具支撑知识专业知识管理史学数学、物理统计学运筹学管理计量分析哲学经济学社会学心理学计算机(软件)2022-7-212第1章 总论一、数据分析的意义2、定类分析类课程的实用性 背景分析1:企业生产经营方式 背景分析2:定价与销售效果 背景分析3:社会救助与公司解雇 背景分析4:销售因素诊断2022-7-213第1章 总论v二、数据、模型与决策关系数 据模 型管理决策分析2022-7-214第1章 总论二、数据、模型与决策关系数 据 1数 据 2数 据 n输 入模处理过程型输 出
2、分 析结 果决 策 方 案2022-7-215第1章 总论三、定量分析的要求 定性分析为先导 管理决策为根本目标 科学方法论为指导 数学模型为主要工具 软件应用为辅助性手段2022-7-216第2章 数据资料的来源、分类与变换本讲的主要内容:一、数据资料的来源二、数据资料的分类三、数据质量检查的两种方法四、数据资料的变换2022-7-217第2章 数据资料的来源、分类与变换v一、数据资料的来源v1、科学研究过程及方法问题定性分析分析定量分析数理分析实证分析2022-7-218第2章 数据资料的来源、分类与变换一、数据资料的来源2、数据是开展定量分析的基础 如果选择实证研究,数据资料的采集可能是
3、一项基础性质的工作。3、数据资料搜集提纲 研究目标,研究对象,研究变量,数据资料搜集的渠道,区分清楚资料的最终用途。2022-7-219第2章 数据资料的来源、分类与变换v一、数据资料的来源v4、数据资料搜集途径数据资料采集直接来源间接来源统计调查实验设计内容分析参与观察商用数据库网上公开资料组织积累资料其他渠道2022-7-2110第2章 数据资料的来源、分类与变换v一、数据资料的来源v4、数据资料搜集途径统计调查全面调查非全面调查普查随机抽样调查非随机抽样调查判断调查任意调查配额调查2022-7-2111第2章 数据资料的来源、分类与变换一、数据资料的来源5、不同抽样方式下的样本单位确定2
4、022-7-2112第2章 数据资料的来源、分类与变换一、数据资料的来源6、样本抽取的电子表格实现 利用EXCEL“数据分析”中的“抽样”可以获得相应抽样方式的样本。2022-7-2113第2章 数据资料的来源、分类与变换v二、数据资料的分类v1、测量尺度分类2022-7-2114第2章 数据资料的来源、分类与变换v二、数据资料的分类v2、时空要素分类2022-7-2115第2章 数据资料的来源、分类与变换三、数据质量检查的两种方法1、数据资料质量 准确性,时效性,代表性,系统性,可比性2、数据资料质量的相对性3、数据质量的影响因素2022-7-2116第2章 数据资料的来源、分类与变换v三、
5、数据质量检查的两种方法v4、数据质量检查2022-7-2117第2章 数据资料的来源、分类与变换四、数据资料的变换1、数据变换的目的 便于运用简单的方法开展分析,迅速获得更加清晰的直观认识,保证数据分析所需要的假定条件得到满足,弱化乃至消除数据资料不准确对计量分析结论的影响,利于选择和建立合适的分析模型。2、数据变换的方法 线性和线性化变换,差分变换,方差稳定化变换,标准化变换等。2022-7-2118第3章 统计资料描述分析本讲的主要内容:一、一般介绍二、数据描述的图表工具三、数据分析的特征数字四、电子表格数据处理2022-7-2119第3章 统计资料描述分析一、一般介绍 围绕某个问题开展研
6、究,可以采用定性和定量分析两种逻辑。2022-7-2120第3章 统计资料描述分析一、一般介绍 实证分析的基础是占有数据资料,采集到必要的数据后,通常需要对数据资料实施描述性分析。2022-7-2121第3章 统计资料描述分析二、数据描述的图表工具1、统计表的种类2、频数分布 频数分布是统计资料整理和描述分析过程中经常使用的一种方法,频数分布能对观察资料实施大幅度的压缩和提炼,可以使资料以更加清晰、简洁的形式展现出来,从而便于直观地了解现象的内部结构。频数分布是在统计分组的基础上形成的样本单位在各个组间的分配。2022-7-2122第3章 统计资料描述分析二、数据描述的图表工具3、EXCEL频
7、数分布的制作 利用EXCEL中的函数FREQUENCY,可以编制频数分布,具体过程是:首先确定分组组数和组限,一次性选定与组数大小相同的空白行,然后编写函数“=FREQUENCY(数据区域,每个组的上限值)”,最后按CTRL+SHIFT+ENTER。2022-7-2123第3章 统计资料描述分析二、数据描述的图表工具4、频数分布中的几个概念(1)频数。每个组观察值出现的次数,统称为频数,用以反映各组观察值发生的频繁程度。(2)频率。各个组中的频数与所有组频数之和的比率。(3)累积频数。几个相关组发生频数的合计,能够反映组合并后的观察值总共出现的次数。(4)累积频率。几个相关组发生频率的累加和,
8、能够用于描述和解释组合并后观察值出现的相对频繁程度。2022-7-2124第3章 统计资料描述分析二、数据描述的图表工具5、数据描述的图形显示(1)直方图、折线图与曲线图:功能与绘制;(2)累积分布图:功能与绘制;(3)饼形图与圆环图;(4)帕雷特图:应用与绘制;(5)雷达图:功能、阅读与绘制;(6)散点图:功能、应用与绘制;(7)茎叶图:含义、作用于制作。2022-7-2125第3章 统计资料描述分析三、数据分析的特征数字(一)综述2022-7-2126第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字1、定量数据集中趋势的特征数字 定量数据集中趋势的特征数字,常用的有算
9、术平均数、中位数、众数、截尾均值等。(1)算术平均数:含义,计算方法,应用。(2)中位数与四分位数:含义,计算,应用。(3)众数:含义,计算方法,应用。(4)截尾均值:含义,计算方法,应用。2022-7-2127第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(1)算术平均数、中位数、众数的结合应用 将算术平均数、中位数和众数结合起来,可以大致判断现象存在的对称性。如果现象存在的状态是对称的,算术平均数、中位数与众数完全相同。算术平均数、中位数或众数不相同,说明现象存在的状态不对称,算术平均数大于中位数或众数,表明现象呈右偏态,频数分
10、布的尾巴拖向右边。算术平均数小于中位数或众数,表明现象呈左偏态,频数分布曲线的尾巴拖向左边。2022-7-2128第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(2)中位数与四分位数的结合应用 从方法性质上,中位数与四分位数没有本质的不同,都是根据样本数据排序的位置确定的,所以常称为位置集中趋势测度。但将它们结合起来使用,也能发挥更大的作用。比如经常见到的“箱线图”。2022-7-2129第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(3)马尔可夫不等式 为一组非负观察值
11、,为算术平均数,k为大于1常系数,则有表明某个数值不小于算术平均数k倍的概率不会超过1/k。nxxx,.,21xkxkXP12022-7-2130第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字3、定量数据离散趋势特征数字 观察值之间的差异程度或频数分布的分散程度,称为离散趋势。常用的离散趋势的特征数字有:极差,四分位数差,方差与标准差。(1)极差:含义,计算,应用。(2)四分位数差:含义,计算,应用。(3)方差与标准差:含义,计算,应用。2022-7-2131第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字4、定量数据离散趋势特征数字的综合应用(1
12、)数据资料标准化。(2)变异系数 变异系数是把算术平均数与标准差联系起来的一个测度。njsxxxjj,.,2,1,2022-7-2132第3章 统计资料描述分析三、数据分析的特征数字(二)定量数据的特征数字4、定量数据离散趋势特征数字的综合应用(3)切比雪夫经验规则 切比雪夫定理:任何一个数据集中,至少有 个数据出现在均值Z个标准差的范围,其中Z是一个大于1的数。2/11z2022-7-2133第3章 统计资料描述分析三、数据分析的特征数字(二)定性数据的特征数字1、定性数据集中趋势的特征数字 属性资料集中趋势的测度主要是:众数,中位数,四分位数等。2、定性数据离散趋势的特征数字(1)离散比率
13、kjjekjjcfffV1mod12022-7-2134第3章 统计资料描述分析三、数据分析的特征数字(二)定性数据的特征数字2、定性数据离散趋势的特征数字(2)GINI-SIMPSON指数(3)熵kjjSIMPSONGINIpC121jkjjppHln12022-7-2135第3章 统计资料描述分析四、电子表格数据处理 利用EXCEL加载宏中的“数据分析”,可以一次性处理数量数据相关的特征数字计算。具体过程是:在EXCEL工作表中录入需要处理的数据;点击菜单栏中的“数据”,从右上方找到“数据分析”;在弹出的对话框中,选择“描述统计”,然后按“确定”;在新弹出的对话框中,将待处理数据所在的范围
14、输入到“输入区域”框中,指定输出区域,选定“汇总统计”。2022-7-2136第4章 参数样本推断 本讲的主要内容:一、统计量与抽样分布 二、参数估计应用 三、假设检验应用四、EXCEL中的“数据分析”2022-7-2137第4章 参数样本推断 一、统计量与抽样分布 1、参数与统计量 特征数字有总体特征数字和样本特征数字之分。总体特征数字是根据研究对象全体调查资料计算的,反映了研究对象总体的基本信息,常被叫做参数。样本特征数字是根据研究对象中抽取出来的部分代表性单位即样本观察数据计算的,反映了样本资料的基本信息,也叫统计量。2022-7-2138第4章 参数样本推断 一、统计量与抽样分布 2、
15、统计量的抽样分布 统计量是样本的函数,随着抽取的样本的变化,得到的统计量值彼此之间存在差异。为了搞清统计量的性质,需要借助频数分布的概念,以揭示统计量取值的变化情况。抽样分布就是,从总体中抽出相同容量的全部样本,并计算出统计量的值,然后按统计量的值编制出来的频数分布。2022-7-2139第4章 参数样本推断 一、统计量与抽样分布3、常用的统计量抽样分布(1)单样本均值抽样分布(2)两样本均值差的抽样分布),(2nNX)1(,(2fnNX)2(112)1()1(11222mntmnSYXmnSmSnmnYXWYXYXYX2022-7-2140第4章 参数样本推断 一、统计量与抽样分布3、常用的
16、统计量抽样分布(3)样本比例数的抽样分布(4)样本方差的抽样分布),(npqpNp),(mqpnqpppNppYYXXYXYX)1()1(222nSn)1,1()1()1()1()1(22222222mnFSSmSmnSnFXYYXYYXX2022-7-2141第4章 参数样本推断 二、参数估计应用 1、点估计 点估计也叫定值估计,它针对总体参数的性质构造估计用统计量,然后由样本资料计算出统计量的值,并直接作为相应总体参数值的替代。用一句话来说,就是用单个统计量的值作为总体参数值的近似或估计。2022-7-2142第4章 参数样本推断 二、参数估计应用 1、点估计 从实用的角度,在此把点估计做
17、一归纳。xxyxyxppyxppyxpp eMeMoMoM2njjxxnS1221122SnjjxxnS1211S2022-7-2143第4章 参数样本推断 二、参数估计应用 2、区间估计(1)单总体均值区间估计(2)两总体均值差区间估计1)1()1(2211ntnSXntnSXP111)2()(11)2()(2211mnSmntYXmnSmntYXPWYXW2022-7-2144第4章 参数样本推断 二、参数估计应用 2、区间估计(3)总体比例数区间估计nppzpnppzp)1(,)1(2211mppnppzppmppnppzppYYXXYXYYXXYX)1()1()(,)1()1()(22
18、112022-7-2145第4章 参数样本推断 二、参数估计应用 2、区间估计(4)总体方差区间估计)1()1(,)1()1(2221222nSnnSn)1,1(,1,12222122mnFSSmnFSSYXYX2022-7-2146第4章 参数样本推断 三、假设检验应用1、总体均值检验(1)单样本总体均值检验(2)两总体均值差检验1210ntSnXC)2(1121mntmnSYXCW2022-7-2147第4章 参数样本推断 v三、假设检验应用v2、总体比例数检验v3、总体方差检验21000)1(zppnppC21zmqpnqpppCYYXXYX111121202220222nSnnSnC1
19、,11,12212222mnFSSmnFSSCYXYX2022-7-2148第4章 参数样本推断 四、EXCEL中的“数据分析”1、EXCEL的参数估计 利用EXCEL中的“数据分析”可以做参数的点估计与区间。以均值为例,运行“数据分析”得到输出结果后,直接以特征数字作为点估计,将均值和置信度做减和加处理,便能得到区间估计。其他的估计,可以在电子表格中直接编写计算公式。2022-7-2149第4章 参数样本推断 四、EXCEL中的“数据分析”2、EXCEL的参数假设检验 EXCEL中的“数据分析”带有两样本等方差、异方差等检验功能,使用过程是:第一步,在EXCEL工作表中编录数据;第二步,从菜
20、单栏“数据”的右上方找到“数据分析”并打开;第三步,在弹出的对话框中,打开“t-检验:双样本等方差假设”,根据提示进行相关设定即可。2022-7-2150第5章 方差分析及其应用本讲的主要内容:一、方差分析的基本问题二、单因素方差分析三、两因素方差分析四、电子表格求解2022-7-2151第5章 方差分析及其应用一、方差分析的基本问题1、含义 方差分析是在若干个能够互相比较的资料组中,把产生变异的原因加以明确区分的方法和技术。2、假定条件 实验相互独立,实验误差服从正态分布,等方差。3、基本思想 某一因素水平下的实验结果,由于实验条件相同,数据间的差异可看成是随机性误差引起的,不同因素水平下的
21、实验数据因实验条件改变,其间的差异可看成主要是实验条件改变造成的。随机误差服从正态分布,因此每一因素水平下的实验数据又可当作是来自这一因素水平的总体的一个样本,理论上应该有一个均值 。如此一来,因素影响是否显著就转化为检验 是否相等的问题。r,21j2022-7-2152第5章 方差分析及其应用二、单因素方差分析1、单因素等重复方差分析(1)提法 实验中只考虑一个因素A,分r 个水平作观察,每个水平下的实验结果均服从正态分布且方差相等。为检验 是否相等,对每个水平都做n 次实验(等重复的含义),且保证各次实验相互独立。r,212022-7-2153第5章 方差分析及其应用二、单因素方差分析1、
22、单因素等重复方差分析(2)检验统计量其中)1(,1()1(/)1/(22nrrFnrSrSFwbrjjbXXnS12.2).(rjnijijwXXS112.2)(2022-7-2154第5章 方差分析及其应用二、单因素方差分析2、单因素不等重复方差分析(1)提法 实验中只考虑一个因素A,分r 个水平作观察,每个水平下的实验结果均服从正态分布且方差相等。为检验 是否相等,对每个水平所做的实验次数不一定相等,但各次实验相互独立。r,212022-7-2155第5章 方差分析及其应用二、单因素方差分析2、单因素不等重复方差分析(2)检验统计量其中)1(,1()1(/)1/(1122jrjrjjwbn
23、rFnSrSFrjnijbjXXS112.2).(rjnijijwjXXS112.2)(2022-7-2156第5章 方差分析及其应用三、两因素方差分析1、无重复两因素方差分析(1)提法 实验中考虑两个因素,用A、B表示,A因素取r个水平,B因素取s个水平,对A、B的每一水平搭配只作1次实验(无重复),实验结果服从正态分布。检验的问题:因素A和因素B对实验结果是否有显著影响。2022-7-2157第5章 方差分析及其应用三、两因素方差分析1、无重复两因素方差分析(2)检验统计量其中)1)(1(,1()1)(1/()1/(22srrFsrSrSFEAA)1)(1(,1()1)(1/()1/(22
24、srsFsrSsSFEBBriiAXXsS12.2)(sjjBXXrS12.2)(risjjiijEXXXXS112.2)(2022-7-2158第5章 方差分析及其应用三、两因素方差分析2、等重复两因素方差分析(1)提法 实验考虑两个因素A和B,A因素取r个水平,B因素取s个水平,对A与B的每一水平搭配分别作l次实验(等重复),实验结果服从正态分布,且各次实验相互独立。检验的问题是,因素A、因素B及其搭配对实验结果是否存在显著的影响。2022-7-2159第5章 方差分析及其应用三、两因素方差分析2、等重复两因素方差分析(2)检验统计量其中)1(,1()1()1(22lrsrFlrsSrSF
25、EAA)1(,1()1()1(22lrssFlrsSsSFEBB)1(),1)(1()1()1)(1(22lrssrFlrsSsrSFEABABriiAXXslS12.2)(sjjBXXrlS12.2)(risjjiijABXXXXlS112.2)(riijsjlkijkEXXS12.112)(2022-7-2160第5章 方差分析及其应用四、电子表格求解1、单因素方差分析 方差分析的计算工作量大,利用EXCEL中的“数据分析”功能,很容易能实现数据的处理。单因素方差分析实现过程:第一步,将实验数据输入到EXCEL工作表中;第二步,点击菜单栏“数据”,在右上方的“数据分析”找到并打开“方差分析
展开阅读全文