管理数量方法与分析(全套课件161P).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理数量方法与分析(全套课件161P).ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 数量 方法 分析 全套 课件 161
- 资源描述:
-
1、管理数量方法与分析第一章.数据分析的基础1.1。数据分组与变量数列1.1。1 数据分组1。数据分组:是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律。2.数据分组分类:(1)单项分组;(2)组距分组3.单项分组:若变量是离散型变量,且取值只有不多的几个时,则采用单项分组4.组距分组:若变是连续型变量,或者是取值较多的离散型变量,则采用组距分组1.1。2 变量数列1.变量数列概念:在对变量取值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排成的数列,称为变量数列。2.变量数列的两要素:(1)组别:不同变量值所划分的组,(2)频
2、数:各组变量值出现的次数。频率:各组次数与总次数之比叫比率,又称频率3.变量数列的编制:(1)确定组数:(2)确定组距:(3)确定组限: a:下限 b:上限(4)计算各组的次数(5)编制变量数列2lglg1lg322. 31NNm mxxdiiminmaxba,4.累计频数和累计频率(1)向上累计频数和累计频率:当我们关心的是变量值比较小的现象的次数分布情况时,通常采用向上累计频数和累计频率,以表明所关注的某一较低变量值以下的变量值出现次数占次数的比重(2)向下累计频数和累计频率:当我们关心的是变量值比较大的现象的次数分布情况时,通常采用向下累计频数和累计频率,以表明所关注的某一较高变量值以下
3、的变量值出现次数占次数的比重5.累计频数和累计频率分布曲线 以分组变量为横轴,以累计频数(频率)为纵轴划图6.洛伦茨曲线绘制方法(表明财富,土地,工资是否公平)(1)将分配的对象和接受分配者的数量均化成结构相对数并进行向上累计(2)纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象(如财富,土地,收入),横轴由左向右用以测定接受分配者(如人口)(3)根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线7.变量数列分布图(1)柱状图:用来显示单项分组的次数分布(2)直方图:是用顺序排列的各区间上的直方条表示变量在各区间
4、内取值的次数或频率的图形。可用来显示变量的的组距分组次数分布。(3)折线图:在直方图中将各方条顶端中点用线段连接起来,并在最低组之前和最高组之后各延长半个组距,将所连折线再连接到横轴上所成图形。1.2分布中心的尺度1.2。1 分布中心的概念及其意义1.分布中心概念:是指距离一个变量的所有取值最近的位置2.分布中心的意义:(1)变量的分布中心是变量的一个代表,可以用来反映其取值的一般水平。(2)变量的分布中心可以揭示其取值次数分布在直角坐标系上的集中位置,可以用来反映变量分布曲线的中心位置1.2。2 分布中心的测度指标及其计算方法1.算术平均数(1)简单算术平均数:(2)加权算术平均数: (组距
5、式也适用)(3)应用算术平均数应注意的几个问题第一:算术平均数容易受到极端变量值的影响第二:权数对平均数大小起着权衡轻重的作用第三:根据组距数列求加权算术平均数时,需用组中值作为各组变量值的代表xnxnxxxxniin121niiniiinnnffxffffxfxfxx11212211(4)算术平均数的数学性质第一:各变量值与算术平均数离差的总和等于零:第二:各变量值与算术平均数离差距平方和为最小: 最小第三:变量线性变换的平均数等于变量平均数的线性变换第四:n个相互独立的变量的代数和的平均数等于其平均数的代数和(5)算术平均数的变形调和平均数x0 xx2xx1.2。2 分布中心的测度指标及其
6、计算方法1.算术平均数(1)简单算术平均数:(2)加权算术平均数: (组距式也适用)(3)应用算术平均数应注意的几个问题第一:算术平均数容易受到极端变量值的影响第二:权数对平均数大小起着权衡轻重的作用第三:根据组距数列求加权算术平均数时,需用组中值作为各组变量值的代表xnxnxxxxniin121niiniiinnnffxffffxfxfxx112122112.中位数(1)中位数概念:是指将某一变量的变量值按照从小到大的顺序排成一列,位于这列数中心位置上的哪个变量值(2)单项式数列中位数的确定方法第一:从小到大的顺序排成一列第二:这列数中心位置上的哪个变量值(3)组距式数列中位数的确定方法 下
7、限公式: 上限公式:中位数组 的确定:累加后第一次超过一半的哪一组其中 代表变量值小于中位数的各组次数之和; 代表变量值大于中位数的各组次数之和; 代表中位数所在组的次数; :代表中位数所在组的组距dfSfLmmme12dfSfUmmme12UL,1mS1mSmfd3.众数(1)众数的概念:是指某一变量的全部取值中出现次数最多的哪个变量值(2)单项式数列众数的确定:找出出现次数最多的变量值即可(3)组距式数列众数的确定方法 下限公式: 上限公式:众数组 的确定:出现次数最多的组; :代表众数组的组距 代表众数组的次数与前一组次数之差; :代表众数组的次数与后一组次数之差0mdLm2110dUm
8、2120UL,d121.2。3 算术平均数,中位数和众数三者之间的关系1.正态分布情况:算术平均数,中位数和众数三者完全相等 2.正偏分布或右偏分布:算术平均数右远离众数,中位数居中,众数在图形最左边 3.负偏分布或左偏分布:算术平均数左远离众数,中位数居中,众数在图形最右边4.经验公式(在适度偏斜的情况下): 0mmxexmme00mmxexmme2301.3 离散程度的测度1.3。1 离散程度测度的意义1.离散程度概念:各个取值的离散程度即差异程度的大小2.离散程度测度的意义:(1)通过对变量取值之间离散程度的测定,可以反映各个变量值之间的差异大小,从而也就可以反映分布中心指标对各个变量值
9、代表性的高低;(2)通过对变量取值之间离散程度的测定,可大致反映变量次数分布密度曲线的形状。1.3。2 离散程度的测度指标1.极差(全距):2.四分位全距: 其中: 分别称为第一,第二,第三个四分位数3.平均差:(1)简单平均差:(2) 加权平均差: iixxRminmax21QQIQR321,QQQDA.nxxnxxxxxxDAniin121.niiniiinnnffxxffffxxfxxfxxDA11212211.4.标准差: (1)标准差的概念:是变量的各个取值偏差平方的平均数的平方根 (2)简单标准差: (3)加权标准差:nxxnxxxxxxniin1222221niiniiinnnf
10、fxxffffxxfxxfxx1122122221215.方差: 标准差的平方 (1)变量的方差等于变量平方的平均数减平均数的平方。(2)变量与算术平均数离差平方和具有最小的性质。(3)变量线性变换的方差等于变量的方差乘以变量系数的平方 若: ,则:2222nxnxnAxnxx22bxay222xyb(4)n个独立变量代数和的方差,等于各变量方差的代数和 若: ,则:(5)n个独立变量代数和的标准差,不大于各变量标准差的代数和若: ,则:nxxxy21222221nxxxynxxxy21nxxxy216.变异系数:用于不同变量的各自之间差异程度的比较(1)极差系数:(2)平均差系数:(3)标准
11、差系数:%100 xRVR%100.xDAVDA%100 xV1.4 偏度和峰度1.4。1 偏度和峰度1.偏度:是指其取值的偏斜程度2.峰度:是指其取值分布密度曲线顶部的平坦程度和尖峭程度1.4。2偏度的测度1.直观偏度系数(1)皮尔逊偏度系数: (2)鲍莱偏度系数: 0mxskp33psk 131003QQQmmQskb11bsk2.矩偏度系数: 其中:(1)矩偏度系数的值越大,变量分布的偏斜程度越大,矩偏度系数的值越接近于0,变量分布的偏斜程度就越小,当变量的分布为对称分布时,矩偏度系数: 为0;(2)当变量的分布为正偏时,该系数为正,当变量的分布为负偏时,该系数为负msk33Sskmnx
12、xS33msk1.4。3 峰度的测度1.峰度系数:用于观测变量分布密度曲线顶峰的尖峭程度的测定2.峰度系数公式: 其中:3.峰度系数的特征;(1)当峰度系数 时,变量的分布为正态分布 (2)当峰度系数 时,变量的分布的密度曲线的顶端为比较平坦 (3)当峰度系数 时,变量的分布的密度曲线的顶端为比较尖峭44Sku nxxS443ku3ku3ku1.5 两个变量的相关关系1.5。1测度两个变量相关程度的意义1.函数关系:两个变量之间存在确定性的依存关系2.不相关:两个变量之间没有任何关系3.相关关系:两个变量之间存在不确定性的依存关系1.5。2测度两个变量相关程度的指标1.协方差:(1)简单协方差
13、:(2)加权协方差:2.相关系数: ( ) 其中: 分别表示样本变量x,y的标准差xySnyyxxyyxxnyyxxSnnniiixy111niiniiiixyffyyxxS11xyr11xyryxxyxySSSryxSS ,第二章.概率和概率分布2.1。随机事件和概率2.1。1随机事件1.相关概念(1)随机事件:可能发生也可能不发生的结果。记为:(2)必然事件(样本空间) :随机实验必然出现的结果(3)不可能事件 :随机实验不可能出现的结果,CBA2.事件的关系与运算(1)事件的包含:若事件A发生必然导致B发生,则A包含于B。记为:(2)事件的相等:若A包含于B,B包含于A,则A与B相等。记
14、为(3)事件的并(也称事件的和):事件A和事件B至少有一个发生。记为: 或(4)事件的交(也称事件的积):事件A和事件B同时发生。记为: 或(5)事件的差:事件A发生和事件B不发生。记为:BABABABABAABBA(6)不相容事件(也称互斥事件):若A和B不可能同时发生,即 ,则A和B互斥(7)对立事件 :(8)完备事件组: 同时满足: ABAAAnAAA,21jiAAjinAAA212.1。2随机事件的概率1.概率的定义:随机事件A发生的可能性大小的度量(数值),称为事件A的概率。记为2.概率的性质(1)(2) (3)若A和B互不相容(互斥),则:(4) AP 10AP 1P 0P BPA
15、PBAP APAP12.1。2随机事件的概率1.概率的定义:随机事件A发生的可能性大小的度量(数值),称为事件A的概率。记为2.概率的性质(1)(2) (3)若A和B互不相容(互斥),则: AP 10AP 1P 0P BPAPBAP ABPBPAPBAP ABPAPBAP APAP12.1。3古典概率 2.1.4条件概率与事件的独立性1.条件概率定义: 表示的事件A发生的条件下,事件B发生的条件概率2.乘法公式:3.全概率公式:若 是一个完备事件组,则对任一事件A都有 样本空间中全部样本点包含的样本点AnmAP APABPABP BPBAPAPABPABPnBBB,21 iniinnBAPBP
16、BAPBPBAPBPBAPBPAP122114.贝叶斯公式:若 是一个完备事件组,则有 nBBB,21 niiiiiiiBAPBPBPBAPAPABPABP12.2 随机变量及其分布2.2。1.随机变量的概念1.随机变量定义:设随机试验E的样本空间 ,若对于每一个 ,都对应唯一实数 ,则称变量 为随机变量,记作:2.随机变量特点:(1)随机性 (2)统计规律性 (3)它是定义在样本空间 上的实单值函数 ee eX eXX2.2。2随机变量的概率分布1.离散性随机变量的概率分布 (1) (2) X . . P . .1x1p2x2pnxnp0kp11ikp2.2.常用的离散性随机变量的概率分布常
17、用的离散性随机变量的概率分布(1)两点分布()两点分布(0-1分布)分布) 01(2 2)超几何分布)超几何分布 (3 3)二项分布:)二项分布: pnB,nNknDNkDCCCkXPnk, 2 , 1 , 0(4 4)泊松分布:)泊松分布: 3.3.连续性随机变量的概率分布连续性随机变量的概率分布 (1 1)分布函数:)分布函数: 概率密度:概率密度:(2 2)概率密度性质:第一:)概率密度性质:第一: 第二:第二: (3 3)分布函数性质:)分布函数性质: 第一:第一: 第二:第二: 第三:第三: PekkXPk!nk, 2 , 1 , 0 xdttfxF 0 xf badxxfbXaP
18、1dxxf bFbXP aFaXP1 aFbFbXaP4.4.常用的连续性随机变量的概率分布常用的连续性随机变量的概率分布(1 1)均匀分布:)均匀分布: 概率密度:概率密度: 分布函数:分布函数:(2 2)指数分布:)指数分布: 概率密度:概率密度: 分布函数:分布函数:(3 3)正态分布:)正态分布: 概率密度:概率密度: 分布函数:分布函数:(4 4)正态分布性质;)正态分布性质; 第一:第一: 关于直线关于直线 xfx对称对称; ;在在 有拐点有拐点x 第二: 在 处达到最大值 ,该位置处也是 分布的中位数和众数 xfx21 第三:当 时, ,即曲线及 以 x轴为渐近线x 0 xf x
19、fy 第四:当 越大时,曲线越平缓,当 越小时,曲线越陡峭2,N(5)标准正态分布:)标准正态分布: 概率密度:概率密度:分布函数:分布函数:(6 6)正态分布重要公式:若)正态分布重要公式:若 第一:第一:第二:第二:第三:第三:第四:bbXPaaXP1abbXaP2,NX aa1 xexx,2122 xxdxex22211 , 0N2.3 随机变量的数字特征与独立性2.3。1 随机变量的数字特征1.数学期望:(1)离散性随机变量的数学期望:(2)连续性随机变量的数学期望:(3)数学期望性质:第一: 第二: xE iniinnpxpxpxpxXE12211 dxxxfXE bXaEbaXE
20、YbEXaEbYaXE 2.方差: 标准差:(1)方差定义: 第一: 第二:(2)方差计算公式:(3)方差性质: 第一: 第二:若X和Y相互独立,则 XDXD niiXExXEXEXD122 dxXExXEXEXD22 22XEXEXD XDabaXD2 YDbXDabYaXD223.常用分布的期望和方差(1)两点分布:(0-1分布) 期望: ; 方差: pXE pppqXD1(2)二项分布:pnB,期望: 方差: npXE pnpnpqXD1(3)泊松分布: 期望: 方差: P XE XD(4)均匀分布: 期望: 方差:(5)指数分布 期望: 方差:(6)正态分布: 期望: 方差:baU,
21、2baXE 122abXD 1XE 21XD2,N XE2XD2.3。2 二维随机变量(略)2.4 大数定律和中心极限定理2.4。1大数定律1.贝努利大数定律(1) (2)2.辛钦大数定律(1) (2)1limpnmPn0limpnmPn11lim1nkknxnP01lim1nkknxnP2.4。2中心极限定理1.林德贝格-勒维中心极限定理:设随机变量相互独立,服从同一分布,且有期望和方差: , 记: 则恒有;2.德莫佛-拉普拉斯中心极限定理:设,则 说明:当 时,二项分布 可化为正态分布 , 其中: nXXX,210,2iiXDXEnnXXDXEXYnkknkknknkkkn1111dtex
22、YPxtnn2221lim10 , ppnBXnxtnndtexpnpnpXP22211limnpnB,2,N pnpXDnpXE1,2第三章。时间序列分析3.1。时间序列概述3.1。1时间序列的概念和种类1.时间序列的概念(1)时间序列概念:是按照时间顺序将观察所得 的某个统计指标(变量)的一组观察值进行排列 而成的序列。(2)时间序列的两要素: 一是指标(或变量)所属的时间,也称时变量; 二是指标(或变量)在所对应的时间上表现的 具体数值。2.2.时间序列时间序列 的分类的分类(1 1)按指标性质分类:)按指标性质分类:第一:时点序列:第一:时点序列:是指由某一时点指标的不同时点上的指标值
23、按照时是指由某一时点指标的不同时点上的指标值按照时间先后顺序排列而成间先后顺序排列而成第二:时期序列:第二:时期序列:是指由某一时期指标的不同时期上的指标值按照时是指由某一时期指标的不同时期上的指标值按照时间先后顺序排列而成间先后顺序排列而成第三:特征序列:第三:特征序列:是指由某一相对指标或平均指标的不同时间上的指是指由某一相对指标或平均指标的不同时间上的指标值按照时间先后顺序排列而成。标值按照时间先后顺序排列而成。(2 2)按指标数值变化特征分类)按指标数值变化特征分类第一:平稳序列:第一:平稳序列:是指一个时间序列的指标数值不存在持续增长是指一个时间序列的指标数值不存在持续增长或下降的趋
24、势,并且其波动的幅度在不同的时或下降的趋势,并且其波动的幅度在不同的时间也没有显著差异,则该时间序列就是一个平间也没有显著差异,则该时间序列就是一个平稳序列。稳序列。第二:非平稳序列:第二:非平稳序列:是指一个时间序列的指标数值存在持续增长或是指一个时间序列的指标数值存在持续增长或下降的趋势,或者其波动的幅度在不同的时间下降的趋势,或者其波动的幅度在不同的时间也有显著差异,则该时间序列就是一个非平稳也有显著差异,则该时间序列就是一个非平稳序列序列3.13.1。2时间序列的影响因素时间序列的影响因素1.1.长期趋势(长期趋势(T):也称趋势变动,是指时间序列在):也称趋势变动,是指时间序列在较长
25、时期内所表现出来的总态势或者变动方向。较长时期内所表现出来的总态势或者变动方向。2.2.季节变动(季节变动(S):也称季节波动,是指时间序列在):也称季节波动,是指时间序列在受自然界更替影响而发生的年复一年的有规律的变化。受自然界更替影响而发生的年复一年的有规律的变化。3.3.循环变动(循环变动(C):也称循环波动,是指变动周期大):也称循环波动,是指变动周期大于一年的有一定规律性的重复变动。于一年的有一定规律性的重复变动。4.4.不规则变动(不规则变动(I):也称随机变动,是指现象受很):也称随机变动,是指现象受很多偶发性的,难以预知和人为无法控制的因素的影响多偶发性的,难以预知和人为无法控
展开阅读全文