书签 分享 收藏 举报 版权申诉 / 82
上传文档赚钱

类型多元正态分布(新)课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4669026
  • 上传时间:2022-12-30
  • 格式:PPT
  • 页数:82
  • 大小:4.04MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《多元正态分布(新)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    多元 正态分布 课件
    资源描述:

    1、网销初级第一章第一章 多元正态分布及其参数估计多元正态分布及其参数估计网销初级多元正态分布的重要性:多元正态分布的重要性:(1)多元统计分析中很多重要的理论和方法都是直接或间接)多元统计分析中很多重要的理论和方法都是直接或间接 地建立在正态分布地建立在正态分布 基础上的,许多统计量的极限分布往往和基础上的,许多统计量的极限分布往往和 正态分布有关。正态分布有关。(2)许多实际问题涉及的随机向量服从多元正态分布或近似)许多实际问题涉及的随机向量服从多元正态分布或近似 服从正态分布。因此多元正态分布是多元统计分析的基础。服从正态分布。因此多元正态分布是多元统计分析的基础。一、多元正态分布的定义一、

    2、多元正态分布的定义定义定义1:若若p维随机向量维随机向量 的密度函数为:的密度函数为:其中,其中,是是p维向量维向量 是是p阶正定矩阵,则称阶正定矩阵,则称X服服从从p维正态分布,记为维正态分布,记为 ),(1pXXX)()(21exp)2(1),(12/11xxppxxfx),(1pxx),(XpN1多元正态分布的定义及其性质多元正态分布的定义及其性质网销初级定义定义2:独立标准正态变量独立标准正态变量 的有限线性组合的有限线性组合 mXX,1mmppXXAYYY11称为称为p维正态随机变量,记为维正态随机变量,记为 其中其中但是但是 的分解一般不是唯一的。的分解一般不是唯一的。),(YpN

    3、AA AA pmppmmaaaaaaaaaA212222111211网销初级定义定义3:若随机向量:若随机向量X的特征函数为:的特征函数为:其中其中t为实向量,则称为实向量,则称X服从服从p元正态分布。特征函数定义的优点在于可以包含元正态分布。特征函数定义的优点在于可以包含 的情况。的情况。ttt it21exp)(0网销初级特别地,特别地,二元正态分布二元正态分布:),(),(221NXXX2222211221121121),()1,0,0(2122112121222221112211),cov(),(,)()(,XXXXXVarXVarEXEX)(2)()()1(21exp121),(22

    4、11111122222211112222221121xxxxxxf网销初级二元正态分布曲面()0,1,112222211网销初级二元正态分布曲面()75.0,4,212222211网销初级即即 ,两个随机变量独立,两个随机变量独立而而 可以求得可以求得 的边缘密度函数为:的边缘密度函数为:21121111112)(exp21)(xxf22222222222)(exp21)(xxf21,XX当当 时时X1与与X2不相关,对于正态分布来说不相关和独立不相关,对于正态分布来说不相关和独立等价。因为此时:等价。因为此时:0为为X1和和X2的相关系数。的相关系数。2)()(exp21),(2222112

    5、22211221121xxxxf)()(),(2121xfxfxxf网销初级二、多元正态分布的性质二、多元正态分布的性质 性质性质1:若:若 ,是对角矩阵,则是对角矩阵,则 相互独立。相互独立。性质性质2:若:若 则则 ),(),(1XppNXX pXX,1),(XpN维常数向量为阶常数矩阵,为sdpsA),(AAdANdAXs性质性质3:若:若 ,将,将 作剖分:作剖分:则则),(XpN,XqqpqqpqqpXXX22211211)2()1()2()1(,),(),(22)2()2(11)1()1(qqNXNX网销初级性质4:p 元正态分布的条件分布仍服从正态分布。即在某些变量取固定值时,另

    6、外一些变量的分布仍然服从多元正态分布。网销初级三、正态分布数据的变换三、正态分布数据的变换若一批多元数据不满足正态分布时,可以对数据进行正态变换。一般来说常采用幂变换,如果想使值变小可以采用变换:21411,ln,xxxx如果想使值变大,则采用变换:32,xx不管使用哪种幂变换,还应该对变换后的数据的正态性做检验.网销初级2多元正态分布的参数估计多元正态分布的参数估计 一、多元样本及其样本数字特征一、多元样本及其样本数字特征多元样本阵多元样本阵记记npnnppXXXXXXXXX212222111211XniXXXXipiii2,1),(21)(网销初级2、多元样本的数字特征、多元样本的数字特征

    7、样本均值:样本均值:pnpnppniiXXXXXXXXXXXXnn2112122221112111)(11样本均值向量可以用样本矩阵表示出来,即)1,1,1(11nn11XnXp网销初级因为:XXXXXXXXXXXXXnXXXXXXXXXnnpnpppnnpnnnpp21212221212111212221212111n111111X网销初级样本离差阵样本离差阵ppijppppppnipippipipippipiiiipipiiiipipiinipipiiiniippssssssssssXXXXXXXXXXXXXXXXXxXXXXXXXXXXXXXXXXXXXXXXXXXXXXS)()()()

    8、()()()()()()()()(212222111211122211122222112112211211221112211)(1)(网销初级样本协方差矩阵样本协方差矩阵 或或 SnV1SnV11样本离差阵用样本资料阵表示为:XX)1(nn11 nISn网销初级因为XXXXXXXXXX)1(1)()()()()()()(1)(1)()()()()(1)(1)()(1)(nnnn1111nInXXnXXXXXXXXXXXXXXXXXXXXXXSnniiniiiiiiniiniiinii网销初级二、多元正态总体的最大似然估计及其性质二、多元正态总体的最大似然估计及其性质利用最大似然法求出利用最大似

    9、然法求出 和和 的最大似然估计为:的最大似然估计为:SnX1网销初级)()(21exp)()(1)(12iininpxx2)()()(),()()2()1(nxfxfxfL)()(21exp)2()(1)(2121 iipnixx求解过程求解过程似然函数为:似然函数为:)()(21exp)()(1)(12iininpxxtr2)(21exp)()()(112iininpxxtr2)(21(exp)()()(112iininpxxtr2网销初级对数似然函数为:对数似然函数为:)(21|ln22ln2),(ln)()(11iinixxtrnnpL)(21|ln22ln211xxnStrnnp)()

    10、(2)(21|ln22ln211xxnStrnnp)(21|ln22ln21Strnnp时等号成立仅当x网销初级)()()()()()()()()(1)(11)()()(1)()(1)()(xxnSxxnxxxxxxxxxxxxxxxxxxniininiiiiniiiniii网销初级)(21|ln22ln2),(ln1StrnnpXL)(|ln22ln21nStrnnp)(|ln|ln22ln211nStrnSnSnnp)(|ln|ln22ln221212121nStrnSnSnnp|ln222ln2nSnnpnpnS时等号成立,即pInSA2/12/1(引理:设A为p阶正定矩阵,则 当A=I

    11、等号成立。pAAtrln)(网销初级最大似然估计的性质最大似然估计的性质 1.,即,即 是是 的无偏估计的无偏估计。,即,即 不是不是 的无偏估计。的无偏估计。,即,即 是无偏估计。是无偏估计。2.分别是分别是 的最小方差无偏估量。的最小方差无偏估量。3.分别是分别是 的一致估计。的一致估计。)(XEXnnSnE1)1(Sn1)11(SnESn 11SnX11,)11(1,SnSnX,网销初级三、维斯特三、维斯特(Wishart)分布分布-一元一元 分布的推广分布的推广定义:定义:设设 个随机向量个随机向量 独立同分布于独立同分布于 ,则随机矩阵则随机矩阵 服从自由度服从自由度为为n的非中心维

    12、斯特分布,记为的非中心维斯特分布,记为n),3,2,1(),(21)(niXXXipiiiX ),(pNni 1)()(iiW),(nWWp2随机矩阵的分布:随机矩阵的分布:npnnppXXXXXXXXXX212222111211将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直将该矩阵的列向量(或行向量)连接起来组成的长向量称为拉直向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则向量,拉直向量的分布定义为该矩阵的分布,如果是对称矩阵则只取其下三角的部分拉直即可。只取其下三角的部分拉直即可。网销初级性质:性质:(1)若)若W1和和W2独立,其分布分别为独立,其分布分别为 和和 ,

    13、则,则 分布为分布为 ,即维斯特,即维斯特(Wishart)分布有可加性。分布有可加性。(2),C为为mp阶的矩阵,则阶的矩阵,则 的分布为的分布为 ),(nWWpCCW),(1nWp),(2nWp21WW),(21nnWp),(CC nWm网销初级定理:定理:设设 分别是来自正态总体分别是来自正态总体 的样本均值和离差阵的样本均值和离差阵,则,则(1)(2)(3)相互独立。相互独立。(4)S为正定矩阵的充分必要条件是为正定矩阵的充分必要条件是 np。SX,),(pN)1,(nNXp),1(nWSpSX,11网销初级一元正态总体:nXX,1为来自一元正态总体的一组样本211)(1niiniiX

    14、XSXnX定理:是相互独立的。与SX证明:构造正交矩阵)1()1()1(1)1(1)1(1)1(10023223123100012112111111nnnnnnnnnnnnnnnnA网销初级做变换nnXXXAYYY2121XnXnYnii1112121212)(XnXXXXXAXAXYYYniiniiniiniiniiYYYS2221122网销初级第三章多元正态总体参数的假设检验第三章多元正态总体参数的假设检验一、一、Hotelling T2分布分布 一元一元t分布的推广分布的推广定义定义 设设 ,且,且X与与S相互独立,相互独立,则称统计量则称统计量 的分布为非中心的的分布为非中心的Hote

    15、lling T分布,记为分布,记为 ,当,当 时称为中心时称为中心的的HotellingT2分布。记为分布。记为),(),(nWSNXpppn XSXnT12),(22npTT0。),(22npTT一元一元t分布分布:设总体设总体 是一组样本是一组样本,则统计量则统计量 ),(2NXnXX,1网销初级)1()(ntXnt其中niiXXn12)(11)()()()(12222XXnXntXSXnT12与 类似并且)1,1()()()()(12222nFXXnXnt网销初级定理:设定理:设 且且X与与S相互独立,相互独立,令令基本性质基本性质:),(),(nWSNXpp0XSXnT12则则)1,(

    16、12pnpFTnppn网销初级二、多元正态总体均值向量的假设检验二、多元正态总体均值向量的假设检验1.单个正态总体单个正态总体(1)协方差矩阵协方差矩阵 已知时均值向量的检验已知时均值向量的检验01000:为已知向量)(:HH检验统计量检验统计量)()()()(201020pXXnT设水平为设水平为 ,查表确定,查表确定 ,使得,使得(当(当H0成立时)成立时))(20TP拒绝域为:拒绝域为:20T网销初级当原假设成立时)1,(0nNXppZZZXnZ2102/1)(令pIDZEZ,0),0(ppINZZZT20网销初级(2)协方差矩阵协方差矩阵 未知时均值向量的检验未知时均值向量的检验 01

    17、000:为已知向量)(:HH检验统计量检验统计量),()1(2pnpFTpnpn)1,()()(1(20102npTXSXnnT拒绝域为:拒绝域为:),()1()(2pnpFTpnpn网销初级例:人的出汗多少于人体内钾和钠的含量有一定的关系。测得20名健康成年女性的出汗多少(X1)、钠的含量(X2)和钾的含量(X3)的数据,做如下的假设检验:0100:)10,50,4(:HH网销初级例:在企业市场结构研究中,起关键作用的指标有市场份额X1,企业规模(资产净值总额的对数)X2,资本收益率X3,总收益增长率X4.为了研究市场结构的变动Shepherd(1972)抽取了美国231个大型企业,调查了这

    18、些企业1960-1969年的资料。假设以前企业市场结构指标的均值向量为:而该次调查得到的企业市场结构指标的均值向量和协方差矩阵为:)2,10,5.7,20(009.178.1106.892.20X346.1233.2019.0156.0233.2626.26222.0639.1019.0222.0513.1080.0156.0639.1080.0260.0网销初级试问市场结构是否发生了变化?0100:)2,10,5.7,20(:HH865.0066.0007.0105.0066.0068.0030.0397.0007.0030.0687.0405.0105.0397.0405.0536.619

    19、1.078.156.092.00X网销初级带入到T2统计量中得到78.3074.1247423042314.124740.5*2312FT临界值37.2)227,4(05.0F因此拒绝原假设,认为市场结构已经发生了显著的变化。网销初级2.协方差阵相等时,两个正态总体均值向量的检验设且两组样本相互独立。(1)有共同已知的协方差矩阵 mYYYYnXXXXpp,2,1),(,2,1),(21)(21)(211210:HH网销初级检验统计量为:成立时)02120()()()(HpYXYXmnnmT拒绝域为:20T网销初级(2)有共同的未知协方差矩阵211210:HH检验统计量为:成立时)02()1,(

    20、)2(1)2(HpmnpFTpmnpmnF)()()2(12YXmnnmSYXmnnmmnT网销初级 21SSS)()()()()(1)(2)(1)(1YYYYSXXXXSnn用 代替即可得到上述统计量。2)1()1(21mnSmSn网销初级例:为了研究日美企业在华投资企业对中国经营环境的评价是否存在差异,现从两国在华投资企业中各抽出10家,让其对如下 指标进行打分。假设两组来自正态总体,有共同的未知协方差矩阵,且两组样本相互独立。211210:HH网销初级经计算)5.70,40,51,5.50()63,5.30,43,64(YX101)()(1510844228845.33238042235

    21、10170880170410)(XXXXS网销初级101)()(25.7625.5213955.31475140165561140390605165605.512)(YYYYS21SSS0025.00002.00016.00002.00002.00013.00004.00002.00016.00004.00022.00003.00002.00002.00003.00011.01S网销初级代入统计量中得:查F分布表得:显然有:故拒绝原假设,认为日、美两国在华投资企业对中国经营环境的评价存在差别。6913.7F89.4)15,4(01.0F)15,4(01.0FF 3.协方差阵不相等时,两个正态总

    22、体均值向量的检验略网销初级一元方差分析一、方差分析的概念及有关术语 方差分析是根据实验数据来推断一个或多个因素在其状态变化时是否会对实验指标产生显著影响的一种数理统计方法。方差分析可以用来研究分类型自变量(名义测度)对数值型因变量的影响。包括它们之间有没有关系、关系的强度如何等,也就是研究一个或多个因素变化时不同总体的某个指标是否有显著差异,所采用的方法就是检验各个总体的均值是否相等。方差分析是用于评价实验的最重要的分析方法。4.多个正态总体均值向量的检验(多元方差分析)网销初级例子:为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本

    23、。每个行业中所抽取的样本在服务对象、服务内容、企业规模等基本上是相同的,统计出消费者对23家企业的投诉次数,现判断几个行业的服务质量是否有差别。投诉次数如下表:返回网销初级假定各个行业在服务对象、服务内容、企业规模等基本相同的前提下,要分析4个行业的服务质量是否有显著差,实际上就是判断“行业”对投诉次数是否有显著影响,即“行业”为自变量,投诉次数为因变量。做出这种判断最终归结为检验4个行业被投诉次数的均值是否相等。如果相等则认为行业因素对投诉次数是没有影响的,如果均值不全相等,则意味着行业因素对服务质量有影响。在做假设检验时每个行业看作是一个总体,因此我们可以简单概括为:方差分析主要用来对方差

    24、分析主要用来对多个总体均值是否相等多个总体均值是否相等作出假设检验作出假设检验。网销初级典型的应用实例:1.不同影院节目宣传方式(如海报和报纸广告)对票房有何影响?影院老板为了知道答案,每次仅用一种方式宣传一段时期,就可以获得样本数据进行方差分析。2.两种营销手段单独作用或共同作用分别对目标变量有何影响?例如,一位果酱生产商认为,商标名称和销售途径有重要影响,于是他对三个不同的商标名称在两种不同销售途径下进行测试。3.对同一个年级的几个班级用不同的教学方法,调查教学效果。网销初级相关术语因素(因子)因素(因子):在方差分析中,所要检验的对象称为因素或因子。例子中的“行业”水平水平:因素中的不同

    25、表现称为水平。例子中的零售业、旅游业、航空公司、家电制造业是“行业”因素的具体表现,即水平。单因素方差分析单因素方差分析:只针对一个因素进行分析;多因素方差分析多因素方差分析:同时针对多个因素进行分析。网销初级(1 1)每个总体(因素的各个水平)的相应变量服从正态分布。也就是说,对于因素的每个水平,其观测值是来自正态总体的简单随机样本,上例中每个行业的投诉次数应服从正态分布。(2 2)所有总体的方差相等2。也就是说,各组观测数据来自相同方差的正态总体。上例中4个行业被投诉次数的方差相同。(3 3)不同观察值相互独立。(每个样本点的取值不影响其他样本点的取值)上例中,每个企业被投诉的次数与其他企

    26、业被投诉的次数是相互独立的。方差分析的三个基本假定网销初级问题的一般提法设因素有r个水平,每个水平的均值分别为 ,要检验r个水平(即为r个总体)的均值是否相等,提出如下假设:与原来两两总体的假设检验方法相比,方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,因此增加了分析的可靠性。,上例中如果用一般的假设检验方法,需要两两组合作6次检验。r,21,不全相等rrHH,:211210网销初级我们画出不同行业投诉次数的散点图零售业 旅游业 航空 家电制造业80604020 0投诉次数行业 网销初级 图中的折线是由投诉次数的均值连接而成的。从图中可以看出不同行业投诉次数是有显著

    27、差异的,而且即使在同一个行业,不同企业的投诉次数也明显不同这表明行业与被投诉次数有关系,因为如果行业与被投诉次数之间如果没有关系,不同行业被投诉次数的均值应该差不多相同。但是,仅仅从散点图上还不能提供充分的证据证明不同行业被投诉次数之间有显著差异,因为也许这种差异是由于抽样的随机性所造成的。因此需要通过对数据误差来源进行分析来判断不同总体的均值是否相等,进而分析某一个因素对实验结果是否有影响。因此进行方差分析时,需要考察数据误差的来源。网销初级 首先,我们注意到同一行业(同一总体)下,样本的观测值是不同的。因为企业是随机抽取的,因此他们之间的差异可以看成是由随机因素的影响造成的,或者说是由抽样

    28、的随机性造成的,我们称之为随机误差。其次,在不同的行业(不同的总体)下,各个观测值也是不同的。这种差异除了抽样的随机性造成的,也可能是由于行业因素本身造成的,由不同行业所形成的误差称之为系统误差。数据的误差用平方和表示。衡量因素的同一水平下(同一总体)下样本数据的误差,称为是组内误差。例如,零售业所抽取的7家企业被投诉次数之间的误差。衡量因素的不同水平(不同总体)下样本之间的误差,称为组间误差。例如,零售业、旅游业、航空业、家电制造业之间被投诉次数之间的误差。网销初级显然,组内误差只包含随机误差,组间误差既包含随机误差也包含系统误差。假如不同行业对投诉次数没有影响,那么在组间误差中只包含随机误

    29、差,而没有系统误差。这时,组内误差和组间误差经过平均后的数值就应该很接近,它们的比值就接近于1.反之,如果不同行业对投诉次数有影响,在组间误差中除了包含随机误差外还包含系统性误差,这时组间误差平均后的值就会大于组内误差平均后的值,它们的比值就会大于1,当这个比值大于某个临界值时,我们就可以说因素的不同水平之间存在显著差异。因此判断行业对投诉次数是否有显著影响这一问题,实际上就是检验投诉次数的差异主要是由什么原因引起的。如果这种差异主要是系统误差,我们就说不同行业对投诉次数有显著影响。网销初级如果原假设成立:如果原假设成立:说明某因素不同水平的影响不显著(无系统性影响),只剩下随机性影响,因此组

    30、间误差与组内误差差别不大,它们的比接近于1。如果原假设不成立:如果原假设不成立:说明某因素不同水平的影响显著(存在系统性影响),组间误差与组内误差差别较大,它们的比远超出1构造统计量:组内误差组间误差F网销初级nxxrjniijj11 为全体样本合并的大样本的样本均值大样本的样本均值jniijjnxxj1为第 j个总体的样本均值的样本均值xij=第j 个子样本中第 i 个观测值;nj=第 j个子样本的样本容量其中,n=n1+n2+nr r为总体的个数于是,大样本的大样本的总误差平方和总误差平方和(Sum of Squares for Total,SST)为:rjniijjxxSST121)(设

    31、39误差平方和的计算误差平方和的计算网销初级211112112)()()(xxxxxxrjnijrjnijijrjnijijjjj rjnijijrjjjjxxxxn11221)()(可以证明:第一项第一项是各子样本均值与合并的大样本的公共均值的离差平方和,它反映了因素不同水平对总离差平方和的影响(系统性影响),称为组间误差平方和组间误差平方和(因素效因素效应误差平方和)应误差平方和)(Sum of Squares for Factor A,SSA);第二项第二项是各子样本内部离差平方和之和,反映了随机性因素的影响(误差性影响),称为组内误差平方和组内误差平方和(Sum of Squares

    32、for Error,SSE)。SSTSSESSA网销初级各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方和大小的影响,用各个平方和除以自由度即得到平均平方误差平均平方误差,简称均方误差,简称均方误差:即 SST=SSA+SSE 总误差平方和总误差平方和=组间误差平方和组间误差平方和+组内误差平方组内误差平方和和rnSSEMSErSSAMSA1构造F统计量:MSEMSAF 当原假设成立时),1(rnrFF网销初级根据给定的显著性水平,查表得到拒绝域:FF 上例中,经计算13.3)9,3(4.305.0FF说明不同行业被投诉次数的均值有显著差异,这意味着行业(自变量)与投诉次数(

    33、因变量)之间的关系是显著的。网销初级关系强度的测量上述F统计量只能表明自变量和因变量之间是否有关系,不能表明关系的强弱,为了度量相关强度定义判定系数:SSTSSAR 2R2越大说明关系越强,越小关系越弱。类似于相关系数。上例中,R2=0.349759。这表明行业对投诉次数的影响效应占总效应的34.9759%,而残差效应则占65.0241%。网销初级方差分析中的多重比较上面的分析得出的结论是不同行业被投诉次数的均值是不全相同的,但是究竟哪些均值不相等呢,也就是这种差异究竟出现在哪些行业之间呢?则需要对总体均值进行两两比较。多重比较的方法有很多,我们简单介绍一下由Fisher提出的最小显著差异方法

    34、(LSD方法)。检验步骤为:第一步:提出原假设:jijiHH:,:10第二步:计算检验统计量:|jixx 第三步:计算LSD,公式为:)11()(2jinnMSEkntLSD第四步:根据显著性水平做出决策:如果则拒绝原假设,否则接受原假设。LSDxxji|网销初级例:对4个行业的均值作多重比较05.0第一步:提出假设431430311310211210:,:,:,:HHHHHH:检验:检验:检验621第二步:计算检验统计量24593514354914849433121xxxxxx网销初级第三步:计算LSD80.15)6151(5.142093.223.10)5171(5.142093.290.

    35、13)6171(5.142093.2621LSDLSDLSD:假设:假设:假设621第四步:做出决策90.13121 xx不能拒绝原假设,说明零售业和 旅游业之间的投诉次数没有显著差异。.网销初级双因素方差分析 单因素方差分析只是考虑一个分类型自变量对数值型因变量的影响。如果同时需考虑两个因素A与B对实验结果的影响,则可进行双因素方差分析双因素方差分析。例:分析影响彩电销售量的因素,需要考察品牌、销售地区等因素的影响。现有4种品牌的彩电在5个地区进行销售,为分析彩电的“品牌”因素和“地区”因素对销售量是否有影响,调查数据如下:地区因素地区因素地区地区1地区地区2地区地区3地区地区4地区地区5品

    36、品牌品牌1365350343340323牌品牌品牌2345368363330333因品牌品牌3358323353343308素品牌品牌4288280298260298网销初级双因素方差分析的数据结构网销初级在双因素方差分析中因为有两个因素,例如“品牌”和“销售地区”两个因素,如果两个因素对销售量的影响是相互独立,我们分别判断两个因素对销售量的影响,称为无交互作用的双因素方差分析。如果除了两个因素的单独影响外,两个因素的搭配还会对销售量产生新的影响效应,例如,某个地区对某个品牌的彩电有特殊偏好,这就是两个因素结合后产生的新效应,此时的双因素方差分析称为有交互作用的双因素方差分析。网销初级无交互作

    37、用的双因素方差分析为了检验两个因素的影响,需要分别对两个因素提出假设。对行因素提出的假设为:不全相等krHH,:211210对列因素提出的假设为:不全相等kkHH,:211210地区对销售量没有显著影响品牌对销售量没有显著影响网销初级误差平方和的分解误差平方和的分解SSESSBSSASST其中:rjkiijxxSST112)(rjjrjkijxxkxxSSA12112).().(21211).().(xxrxxSSBkiirjkii可以证明:rjkijiijxxxxSSE112.)(网销初级分别构造统计量)1)(1(,1()1)(1/(1/)1)(1(,1()1)(1/(1/rkrFrkSSE

    38、rSSBFrkkFrkSSEkSSAFBA关系强度的测量SSTSSBSSAR2反应了这两个因素联合起来与因变量之间的相关程度。网销初级有交互作用的方差分析路段路段1路段路段212619高22420峰32723期425225252162018非71717高82213峰92116期101712例:分别在两个路段和高峰期及非高峰期进行驾车实验,得到20个驾车时间的数据:网销初级个值的总均值全部个水平的样本均值个水平,列因素第对应于行因素第个水平的样本均值列因素第个水平的样本均值行因素第行的观测值个水平的第个水平,列因素第对应于行因素第nxjixjxixljixijjiijl:.rjkimlijlxx

    39、SST1112)(rjjxxkmSSB12).(kiixxrmSSA12.)(rjkijiijxxxxmSSRC112.)(假设行变量有k个水平,列变量有r个水平,行变量每个水平的行数为m网销初级构造统计量:)1(/1/mkrSSEkSSAFA)1(/1/mkrSSErSSBFB)1(/)1)(1/(mkrSSErkSSRCFRCSSRCSSBSSASSTSSE网销初级Wilks分布在一元统计中,方差是刻画随机变量分散程度的一个重要特征,而在多元情况下方差变为协防差矩阵。如何用一个数量指标来反映协方差矩阵所体现的分散程度呢?有的用行列式,有的用迹,目前使用较多的是行列式。定义1:若为广义方差。

    40、式则称协方差矩阵的行列),(pNX为样本广义方差。其中称Sn1)()()(1)(XXXXSinii定义2:若,0),(,),(22111nWApnnWApp相互独立,则称和且21AA211/AAA的分布为Wilks分布,记为 ,其中 为自由度。),(21nnp21,nn在实际应用中把 统计量转化为 T2统计量,进而转化为F统计量。网销初级多元方差分析(多个正态总体均值向量的检验)设有k个p元正态总体),(,),(1kppNN从每个总体抽取独立样本个数为nnnnnnkk211,设数据结构为:ktXXXxxxxxxxxxtntttpntntntptttpttkkkk,2,1)()(2)(1)()(

    41、2)(1)(2)(22)(12)(1)(12)(11全部样本的均值向量pktnitipXXXXnXt2111)(11各总体的均值向量:ktXXXXnXtpttnitittpt,2,1,1)()(2)(11)()(1网销初级与一元方差分析的思想类似,离差平方和变成了离差阵:)()(阵组间离)(1)(XXXXnAtkttt:差矩ktnitititXXXXB11)()()(组内离差矩阵:ktnitititXXXXT11)()()(总离差矩阵:网销初级提出假设:不全相等kkHH,211210:用似然比原则构造的检验统计量为:)1,(kknpBABTB给定检验的显著性水平,查Wilks分布表,确定临界值,拒绝域为:如果没有Wilks分布表可以用 分布和F分布来近似。2网销初级例:1999年国家财政部、国家经贸委、人事部和国家计委联合发布了国有资本金绩效评价规则。其中竞争性工商企业的评价指标体系见表。我们借助这一指标体系对我国上市公司的运营情况进行分析,利用该数据进行方差分析。经过正态性检验我们认为由净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标组成的向量服从正态分布。这四个指标涉及了公司的获利能力、资本结构及成长能力,我们认为这四个指标可以对公司的运营能力作出近似的度量。网销初级网销初级

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:多元正态分布(新)课件.ppt
    链接地址:https://www.163wenku.com/p-4669026.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库