书签 分享 收藏 举报 版权申诉 / 111
上传文档赚钱

类型高级统计学统计学课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:5197330
  • 上传时间:2023-02-16
  • 格式:PPTX
  • 页数:111
  • 大小:4.09MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《高级统计学统计学课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    高级 统计学 课件
    资源描述:

    1、高级统计学高级统计学 葛葛 虹虹高级统计学研究的对象高级统计学研究的对象多指标或多变量数据企业管理:产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率居民家庭消费:家庭收入、家庭人口、阶层、中高档消费品支出等等 点估计 区间估计 假设检验研究内容研究内容简化数据结构 箱式数据箱式数据平面数据平面数据变换主成分分析主成分分析Principle Principle AnalysisAnalysis因子分析因子分析FactorFactorAnalysisAnalysis按观测点分类或按变量分组 分类比较是一切科学比较的基础和开端 对观测点分类:银行发放贷款 对各企业财务指标、

    2、信用状况进行分析 对变量分组:股票市场是宏观经济的晴雨表 经济指标与股票市场各种指标间的群组关系聚类分析聚类分析判别分析判别分析Cluster AnalysisDiscriminant AnalysisRegression AnalysisStructural Equation Model变量间的依存关系+关系的强弱分析寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制内容提要 回归分析1 定性数据的建模2 聚类分析3 判别分析4 主成分分析5 因子分析6 结构方程7教学内容结构教学内容结构回归分析OneOneTwoTwoThreeThree定性数据建模 聚类分析判别分析主

    3、成分分析因子分析高级统计学结构方程预 测回归分析回归分析定性数据建模定性数据建模分 类聚类分析聚类分析判别分析判别分析判 别主成分分析主成分分析因子分析因子分析结构方程结构方程关联性分析综合评价统计学方法的应用以及内容之间的逻辑关系统计学方法的应用以及内容之间的逻辑关系 应用范围教学内容(何晓群 编著)中国人民大学出版社(陆璇 编著)清华大学出版社 预备知识预备知识随机向量及其分布随机向量的数字特征随机向量的样本及其数字特征多元正态分布随机向量及其分布随机向量及其分布P维随机向量:联合分布函数:联合密度函数:),(21pXXX),(),(221121pppxXxXxXPxxxF 1221212

    4、1212121),(),()3(1),()2(0),()1(x xxpppppppdxdxdxxxxfxxxFdxdxdxxxxfxxxf随机向量的数字特征随机向量的数字特征随机向量的数学期望随机向量的方差阵 )(,),(),()(21pXEXEXEE),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()()(212221212111ppppppXXXXXXXXXXXXXXXXXXEEED随机向量的相关系数阵11121212121,XXXXXXXXXXXXppppR)()(),cov(,jijiXXXDXDXXji随机向量的样本及其数字特

    5、征随机向量的样本及其数字特征P维随机向量 的一个容量为n的样本:),(21pXXXpnnnppxxxxxxxxx212221212111,的样本的样本1X 的样的样本本 的样本的样本2XpX样本均值样本均值pnnnppxxxxxxxxx212221212111,nipiniiniipxnxnxnXXX1121121111样本离差阵与样本方差阵样本离差阵与样本方差阵nippiniippiniippinippiiniiniiinippiiniiiniiXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxS12122111122122211122111122111211)()()()()()

    6、()()()(SnV1样本离差阵样本方差阵样本相关系数阵样本相关系数阵1)()()()()()()()()(1)()()()()()()()()(122222221121122222221122211222211112222112211XxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxRippiippiippiippippiippiiiiiippiippiiiiii与与 的样本相关系数的样本相关系数1XpX多元正态分布多元正态分布定义1 q维标准正态分布 设 独立同分布于 ,则称随机向量 服从q 维正态分布,记 Y密度函数:qYYY,21)1,0(

    7、N),(21qYYYY),(qqN)21exp()2(1)(21exp)2(1),(222221221yyyyyyyyfqqqqY定义2 p 维一般正态分布 设 ,B为 实数矩阵,为 维实数向量,则 是 维正态随机向量,记为:其中 为非负定阵。),(qqNYqpp11qqppYBXp),(ppNXBB X定理 1 若 服从 ,则(1),(2)密度函数:定理2 与 分别是 和 的无 偏估计,即),(pNEXDX)()(21exp)2(1),;(1212xxxfpXSn11)(XE)11(SnE回归分析 一元回归模型的建立一元回归模型的建立1 1 回归模型的诊断以及回归模型的诊断以及SPSSSPS

    8、S实实现现2 2 回归模型的矩阵表示回归模型的矩阵表示3 3 多元回归模型的建立多元回归模型的建立4 4 多元回归模型的诊断以及多元回归模型的诊断以及SPSSSPSS实实现现5 5为什么要建立线性模型为什么要建立线性模型一般函数线性化一般函数线性化特殊函数线性化特殊函数线性化简单易分析简单易分析相关性相关性=线性性线性性线性模型线性模型一元回归的一元回归的SPSSSPSS实现实现观察散点图 Graphs Scatter点击点击1 1点击点击2 2点击点击1 1点击点击2 2点击点击3 3点击点击4 4点击点击执行回归过程 Analyze Regression Linear点击点击1 1点击点击

    9、2 2点击点击3 3点击点击4 4点击点击5 5点击点击1 1点击点击2 2点击点击3 3点击点击1 1点击点击5 5点击点击2 2点击点击3 3点击点击4 4点击点击6 6点击点击点击点击2 2可选可选点击点击1 1Model SummaryModel Summaryc,dc,d.999b.998.9987.76600Model1RR SquareaAdjustedR SquareStd.Error ofthe EstimateFor regression through the origin(the no-interceptmodel),R Square measures the prop

    10、ortion of thevariability in the dependent variable about the originexplained by regression.This CANNOT be comparedto R Square for models which include an intercept.a.Predictors:Heightofwifeb.Dependent Variable:Heightofhusc.Linear Regression through the Origind.ANOVAANOVAc,dc,d991602.41991602.3671644

    11、1.553.000a1869.6333160.311993472.0b32RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:Heightofwifea.This total sum of squares is not corrected for the constant because the constant iszero for regression through the origin.b.Dependent Variable:Heightofhusc.Linear Regression thro

    12、ugh the Origind.C Co oe ef ff fi ic ci ie en nt ts sa a,b b1.061.008.999128.225.000HeightofwifeModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable:Heightofhusa.Linear Regression through the Originb.一元回归模型的建立一元回归模型的建立观察由n个样本 构成的散点图或计算样本相关系数,若呈现明显的相关性,建立数学模型 其

    13、中 是未知参数,需要利用样本对它们进行估计.),(,),(),(2211nnyxyxyxxy10),0(2N210,散点图(散点图(1 1)xyxy10ixiyi参数参数 的最小二乘估计(的最小二乘估计(1 1)模型1 最小二乘解:10,),0(.,22110Ndi ixyniiiniiniiixxyyxxxy021110)()(矩阵偏导数与样本矩阵表达矩阵偏导数与样本矩阵表达nyyyY21nxxxX1112121n21AxxAxx2uxxu模型2 最小二乘解:(1)为y关于x的回归方程(2)称 为方程的回归系数()(3)称 为残差,为残差向量(4)称 为残差平方和),(),(22nnnnXN

    14、YNXYYXXX1)(xy10),(10iiiyy)()(YYYYSEYYXY 参数参数 的最小二乘估计(的最小二乘估计(2 2)10,散点图(散点图(2 2)xyxy10 ixiyiy iiiiixyyy10 与与 的性质的性质 性质性质1 1 ES)(,(122 XXN 0)(,(2220 xxxNii )(1,(221 xxNi 1 00c11c 性质性质2 ,且 即 的无偏估计是性质性质3 3 与 相互独立 2ES22n2)2(nSEE2)2(2nSEES 性质性质4 4 若若 ,则,则 于是 的 置信区间是:iSii 2ntiicSi i)%1()2(,)2(22iiStStnini

    15、 的样本标准差的样本标准差i一元回归模型的显著性一元回归模型的显著性决定系数法 回归方程的显著性检验 =决定系数法决定系数法 总平方和分解决定系数222)()()(iiiiyyyyyyERTSSS TETRSSSSR 12TESSnnRAdj2112 总平方和总平方和回归平方和回归平方和残差平方和残差平方和df df=n-1=n-1df df=n-2=n-2df df=1=1方差分析法方差分析法(回归方程的显著性检验回归方程的显著性检验)零假设检验统计量0:10 H含义?含义?)2(nSSFER)2,1(nF拒绝域(临界值法):)2,1(nF )2,1(nFFP)2,1(nFF 回归方程显著T

    16、HANK YOUSUCCESS2022-12-555可编辑值法:()(2)RESP FpSnRESS(n-2)P0.05回归方程显著方差分析表(方差分析表(ANOVAANOVA)ModeldfSSMSFresidualTotalregression12 n1 nRSESTSRS)2(nSE)2(nSSER回归系数的显著性检验(回归系数的显著性检验(1 1)零假设检验统计量0:00 H含义?含义?00 ST 2 nt拒绝域(临界值法))2(2 nt)2(2 nt)2(2 ntT2)2(2 ntTP2)2(2 ntTP常数项显著值法00()P TSp00S00SP0.05回归系数显著回归系数的显著

    17、性检验(回归系数的显著性检验(2 2)零假设检验统计量0:10 H11 St 2 nt2t)2,1(nF一元回归模型的诊断一元回归模型的诊断i前提假设前提假设 ),0(.2 Ndiii误差的估计误差的估计残差与残差图)(10iiiiixyyy ni,2,1iiy 残差图残差图(独立、等方差独立、等方差)残差图残差图 残残差差不不独独立立异异方方差差检验检验 的正态性的正态性(Q-QQ-Q图)图))(i),0(2 Nthni)2(2 nSE 的的分位数分位数理论分位数理论分位数样本分位数样本分位数Q-QQ-Q图图(Quantile-Quantile(Quantile-Quantile Plot)

    18、Plot)(i)1()(n)1(nx)(nix)(nnx回归方程的显著性F检验回归系数的显著性t检验残差图-图参数估计误差估计多元回归模型的建立多元回归模型的建立模型 基本形式:样本表达:矩阵表达:ppxxxy22110),0(2 N ),0(.,22122110 Ndiixxxyniippiii),(),(22nnnnXNYNXY Model SummaryModel Summaryb b.965a.932.927433.56533Model1RR SquareAdjustedR SquareStd.Error ofthe EstimatePredictors:(Constant),新增固定

    19、资产,人均GDPa.Dependent Variable:农村纯收入b.ANOVAANOVAb b71666083235833041.71190.623.000a526340928187978.8967692949230RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),新增固定资产,人均GDPa.Dependent Variable:农村纯收入b.C Co oe ef ff fi ic ci ie en nt ts sa a1116.393150.2827.429.000808.5

    20、551424.232.002.000.90516.388.000.002.002.169.078.1202.177.038.010.328(Constant)人均GDP新增固定资产Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95%Confidence Interval for BDependent Variable:农村纯收入a.1116.3930.0020.169GDP农村纯收入人均新增固定资产参数参数 和和 的估计的估计2参数 的最小二乘估计

    21、是参数 的无偏估计是其中 是残差平方和YXXX 1)(2)1(2 pnSE)()(YYYYSE 与 的性质ES性质1 性质2 即 是 的无偏估计性质3 与 相互独立)(,(121 XXNp 2 ES21 pn ES)1(2 pnSE 2 性质4 若若 ,则,则 于是 的 置信区间是:iSii 1 pntiicSi i)%1()2(,)2(11iiStStpnipni 的第的第i+1i+1个对角元个对角元1)(XX性质5 若 (1)(2)且与 相互独立(3)021 p 2 TS21 n 2 RS2p ES)1(pnSpSFER)1,(pnpF多元回归模型显著性检验(多元回归模型显著性检验(1 1

    22、)决定系数法方差分析法 零假设:检验统计量与其分布:TETRSSSSR 12TESSpnnRAdj1112 0:210 pH )1(pnSpSFER)1,(pnpF含义?含义?回归系数的显著性检验(回归系数的显著性检验(2 2)零假设 检验统计量与其分布:其中 是 的第j+1个对角元0:0 jjH jSpnScTjEjjj )1()1(pntjjc1)(XX含义?含义?多重共线性多重共线性什么是多重共线性 p个自变量 在某种程度上是线性相关的多重共线性可以造成参数的估计值严重偏离实际值 一个解释:的共线性使 接近奇异阵,从而使 中的对角分量或 的方差很大.pxxx,21)(,(121 XXNp

    23、 pxxx,21XX 1)(XXi随机模拟方法随机模拟方法 多重共线性对参数估计影响的例 原线性模型:的观测值:正态随机数:由模型得到:回归模型:213210 xxy),(21xx)5.2,4.2(),4.2,3.2(),1.2,0.2(),8.1,9.1(),8.1,8.1(),9.1,8.1(),7.1,7.1(),8.1,7.1(),5.1,4.1(),1.1,1.1(5.0,5.1,6.0,9.1,9.1,2.0,5.0,4.0,5.0,8.0 0.22,3.20,9.20,1.21,9.20,5.19,0.18,2.19,8.16,3.16 Y215907.63073.112924.

    24、11xxy 多重共线性的判定多重共线性的判定方法1 相关系数法 若自变量间的相关系数1,则相应的两个变量之间有较强的共线性。方法2 方差膨胀系数法()若 是把第j个自变量看作因变量,用其余p-1个变量作线性回归所得到的决定系数,则第j个自变量的方差膨胀系数为:ijr2jR211jjRVIFpj,2,1105或VIF方法3 检查统计量的显著性.很大,但没有几个显著的 统计量或 统计量高度显著,而每个 统计量都不显著.方法4 检查系数的标准差.如果几个系数的标准差都很高,而且从方程中去掉一个或几个变量会降低剩下几个变量系数的标准差,此时有可能存在多重共线性.2R共线性诊断的共线性诊断的SPSSSP

    25、SS实现实现点击点击Model SummaryModel Summary.909a.827.777.90718Model1RR SquareAdjustedR SquareStd.Error ofthe EstimatePredictors:(Constant),x2,x1a.ANOVAANOVAb b27.479213.74016.695.002a5.7617.82333.2409RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),x2,x1a.Dependent Variable

    26、:yb.CoefficientsCoefficientsa a11.2921.4637.719.00011.3074.7192.2612.396.048.02835.963-6.5914.436-1.402-1.486.181.02835.963(Constant)x1x2Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.ToleranceVIFCollinearity StatisticsDependent Variable:ya.213210 xxy:215907.63073.112924.

    27、11xxy 克服多重共线性的统计方法克服多重共线性的统计方法 主成分回归主成分回归第一步:寻找主成分 pppppppppppXuXuXuXuXuXuXuXuXuYYYXXX2211222212112121112121)()()(21pYDYDYD 0),(jiYYCOVpji,2,1,第二步:如果第一和第二主成分的累积贡献率超过85%,则建立回归模型22110YYy ppxaxaxaa 22110随机模拟例的主成分回归结果随机模拟例的主成分回归结果第一主成分的贡献率为0.993 y关于第一主成分的回归模型为:最后的整理结果为:41.086.17071.038.081.17071.0211 xx

    28、y11674.15.19yy 210133.21723.28234.11xxy 岭回归岭回归YXkIXXk1)()(YXXX1)(逐步回归逐步回归引进变量过程引进变量过程剔除变量过程剔除变量过程 3ix1ix4ix2ix7ix6ix5ixModel SummaryModel Summaryd d.959a.920.917460.67750.973b.947.943383.31776.977c.955.950356.76717Model123RR SquareAdjustedR SquareStd.Error ofthe EstimatePredictors:(Constant),人均GDPa.

    29、Predictors:(Constant),人均GDP,城镇可支配收入b.Predictors:(Constant),人均GDP,城镇可支配收入,高校数c.Dependent Variable:农村纯收入d.ANOVAANOVAd d70775004170775003.61333.492.000a615448929212223.755769294923072815382236407691.20247.785.000b411411028146932.504769294923073492857324497618.85192.466.000c343663627127282.8137692949230

    30、RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalModel123Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),人均GDPa.Predictors:(Constant),人均GDP,城镇可支配收入b.Predictors:(Constant),人均GDP,城镇可支配收入,高校数c.Dependent Variable:农村纯收入d.C Co oe ef ff fi ic ci ie en nt ts sa a1229.224149.8858.201

    31、.000.002.000.95918.262.0001.0001.000-123.928383.940-.323.749.001.000.5965.577.000.1675.976.218.058.3983.726.001.1675.976-245.776361.228-.680.502.001.000.6056.078.000.1675.986.196.055.3593.557.001.1636.1525.5232.394.0992.307.029.9001.111(Constant)人均GDP(Constant)人均GDP城镇可支配收入(Constant)人均GDP城镇可支配收入高校数Mo

    32、del123BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.ToleranceVIFCollinearity StatisticsDependent Variable:农村纯收入a.方差分析表sourcedfSSMSFresidualTotalregression33.240 2 9 13.740?参数估计表constantx1x2BStd.Error 11.307-6.591 1.463 4.719-1.486 t?7.719 回答如下问题回答如下问题写出回归方程的表达式回归方程是显著的吗?回归系数是显

    33、著的吗?回归系数不显著的原因可能是什么?计算决定系数和调整的决定系数总体标准估计误差是多少?临界值:7374.4)7,2(05.0 F3646.2)7(025.0 t科研案例科研案例.民营化改制对中国产业效率的效民营化改制对中国产业效率的效果果分析分析20012001年全国普查工业数据分析年全国普查工业数据分析.经济研究经济研究,2004,(8):16-26内容提要 本项研究利用了第二次全国基本单位普查数据(2001年),在全部工业的基础上,考察了最新的民营化发展动态,考察20多年来形成的改制面和所产生的相应绩效效果。按照现行的国家规定的企业产权注册的详细分类指标,我们得以将改制企业从一般公有

    34、制或私有制中加以分离,从而能够通过相应的实证模型,来检验不同所有权因素,尤其是改制形式的不同股权类型对于产业效率的影响及程度。主要的发现如下:(1)国有企业(包括传统国有、国有独资企业)对于效率具有明显的负效率,私营企业、股份制企业和三资企业则都表现为积极地对于效率的正相关推动作用。其中,私营企业推动产业效率的作用最强,三资和股份合作企业其次,再次则是股份企业和集体企业。(2)对于改制企业的不同资本股份来说,个人资本普遍具有最显著的对于效率的正相关的积极效果,法人资本表现为显著性不稳定的正相关作用,集体资本表现与效率不相关的结果,而国家资本则表现出十分显著的负相关效果。(3)对于股份有限、有限

    35、责 任和股份合作企业这三种股份企业之间差异的分析表明:股份有限公司的规模效益作用明显小于股份制企业,这是较多的国有产权的消极作用抵消了规模效益的积极作用的结果。相对于股份有限公司,股份合作或有限责任公司的劳动贡献率明显高于资本贡献率,表明这类改制企业在改制后初期主要依靠“劳动推动”或“人力资本推动”来提高企业效率。产业效率决定因素的估计模型产业效率决定因素的估计模型)()(lnlnlnlnLAOWLKAY销售收入销售收入固定资产净值固定资产净值就业人数就业人数所有权结构变量所有权结构变量规模变量规模变量所有权变量的度量:不同注册类型企业的实收资本占该行业总资本的比重(国有、集体、私营、股份合作

    36、、有限公司、股份有限、港澳台合资、港澳台独资、外商合资、外商独资和其他,总共11种产权变量)规模变量的度量:一行业内大型、中型或小型企业的市场份额影响产业效率的国有因素影响产业效率的国有因素因变量因变量参数估计参数估计(T T检验值检验值)截距截距2.699(14.36)LK0.424(12.56)LL0.5770.566-0.5550.801(16.44)(3.21)(6.93)(-8.37)大型大型中型中型国有国有9413.02R1936F605N:国有企业对于效率具有明显的负效率影响产业效率的其他所有制因素股份公司中的不同资本所有权对于效率的作用股份公司中的国家资本所有权对于效率的作用读

    37、书报告读书报告(研究生网站上下载研究生网站上下载)至少两篇文献(所学专业)报告内容包括:研究的目的和意义 研究内容 研究方法 模型、变量的选择;模型的估计结果 结论 参考文献(格式按研究生毕业论文要求)实验报告实验报告(用于上机实验用于上机实验)寻找与本专业研究方向有关的数据 (报告中要给出数据,并说明数据的来源)通过对数据的整理建立相关模型并说明:研究的目的和意义 研究内容 研究方法 模型、变量的选择;模型的估计结果 结论 参考文献(格式按研究生毕业论文要求)110写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits 结束语当你尽了自己的最大努力时,失败也是伟大的,所以不要放弃,坚持就是正确的。When You Do Your Best,Failure Is Great,So DonT Give Up,Stick To The End演讲人:XXXXXX 时 间:XX年XX月XX日

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:高级统计学统计学课件.pptx
    链接地址:https://www.163wenku.com/p-5197330.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库