高级统计学统计学课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《高级统计学统计学课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 统计学 课件
- 资源描述:
-
1、高级统计学高级统计学 葛葛 虹虹高级统计学研究的对象高级统计学研究的对象多指标或多变量数据企业管理:产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率居民家庭消费:家庭收入、家庭人口、阶层、中高档消费品支出等等 点估计 区间估计 假设检验研究内容研究内容简化数据结构 箱式数据箱式数据平面数据平面数据变换主成分分析主成分分析Principle Principle AnalysisAnalysis因子分析因子分析FactorFactorAnalysisAnalysis按观测点分类或按变量分组 分类比较是一切科学比较的基础和开端 对观测点分类:银行发放贷款 对各企业财务指标、
2、信用状况进行分析 对变量分组:股票市场是宏观经济的晴雨表 经济指标与股票市场各种指标间的群组关系聚类分析聚类分析判别分析判别分析Cluster AnalysisDiscriminant AnalysisRegression AnalysisStructural Equation Model变量间的依存关系+关系的强弱分析寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制内容提要 回归分析1 定性数据的建模2 聚类分析3 判别分析4 主成分分析5 因子分析6 结构方程7教学内容结构教学内容结构回归分析OneOneTwoTwoThreeThree定性数据建模 聚类分析判别分析主
3、成分分析因子分析高级统计学结构方程预 测回归分析回归分析定性数据建模定性数据建模分 类聚类分析聚类分析判别分析判别分析判 别主成分分析主成分分析因子分析因子分析结构方程结构方程关联性分析综合评价统计学方法的应用以及内容之间的逻辑关系统计学方法的应用以及内容之间的逻辑关系 应用范围教学内容(何晓群 编著)中国人民大学出版社(陆璇 编著)清华大学出版社 预备知识预备知识随机向量及其分布随机向量的数字特征随机向量的样本及其数字特征多元正态分布随机向量及其分布随机向量及其分布P维随机向量:联合分布函数:联合密度函数:),(21pXXX),(),(221121pppxXxXxXPxxxF 1221212
4、1212121),(),()3(1),()2(0),()1(x xxpppppppdxdxdxxxxfxxxFdxdxdxxxxfxxxf随机向量的数字特征随机向量的数字特征随机向量的数学期望随机向量的方差阵 )(,),(),()(21pXEXEXEE),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()()(212221212111ppppppXXXXXXXXXXXXXXXXXXEEED随机向量的相关系数阵11121212121,XXXXXXXXXXXXppppR)()(),cov(,jijiXXXDXDXXji随机向量的样本及其数字特
5、征随机向量的样本及其数字特征P维随机向量 的一个容量为n的样本:),(21pXXXpnnnppxxxxxxxxx212221212111,的样本的样本1X 的样的样本本 的样本的样本2XpX样本均值样本均值pnnnppxxxxxxxxx212221212111,nipiniiniipxnxnxnXXX1121121111样本离差阵与样本方差阵样本离差阵与样本方差阵nippiniippiniippinippiiniiniiinippiiniiiniiXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxS12122111122122211122111122111211)()()()()()
6、()()()(SnV1样本离差阵样本方差阵样本相关系数阵样本相关系数阵1)()()()()()()()()(1)()()()()()()()()(122222221121122222221122211222211112222112211XxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxXxRippiippiippiippippiippiiiiiippiippiiiiii与与 的样本相关系数的样本相关系数1XpX多元正态分布多元正态分布定义1 q维标准正态分布 设 独立同分布于 ,则称随机向量 服从q 维正态分布,记 Y密度函数:qYYY,21)1,0(
7、N),(21qYYYY),(qqN)21exp()2(1)(21exp)2(1),(222221221yyyyyyyyfqqqqY定义2 p 维一般正态分布 设 ,B为 实数矩阵,为 维实数向量,则 是 维正态随机向量,记为:其中 为非负定阵。),(qqNYqpp11qqppYBXp),(ppNXBB X定理 1 若 服从 ,则(1),(2)密度函数:定理2 与 分别是 和 的无 偏估计,即),(pNEXDX)()(21exp)2(1),;(1212xxxfpXSn11)(XE)11(SnE回归分析 一元回归模型的建立一元回归模型的建立1 1 回归模型的诊断以及回归模型的诊断以及SPSSSPS
8、S实实现现2 2 回归模型的矩阵表示回归模型的矩阵表示3 3 多元回归模型的建立多元回归模型的建立4 4 多元回归模型的诊断以及多元回归模型的诊断以及SPSSSPSS实实现现5 5为什么要建立线性模型为什么要建立线性模型一般函数线性化一般函数线性化特殊函数线性化特殊函数线性化简单易分析简单易分析相关性相关性=线性性线性性线性模型线性模型一元回归的一元回归的SPSSSPSS实现实现观察散点图 Graphs Scatter点击点击1 1点击点击2 2点击点击1 1点击点击2 2点击点击3 3点击点击4 4点击点击执行回归过程 Analyze Regression Linear点击点击1 1点击点击
9、2 2点击点击3 3点击点击4 4点击点击5 5点击点击1 1点击点击2 2点击点击3 3点击点击1 1点击点击5 5点击点击2 2点击点击3 3点击点击4 4点击点击6 6点击点击点击点击2 2可选可选点击点击1 1Model SummaryModel Summaryc,dc,d.999b.998.9987.76600Model1RR SquareaAdjustedR SquareStd.Error ofthe EstimateFor regression through the origin(the no-interceptmodel),R Square measures the prop
10、ortion of thevariability in the dependent variable about the originexplained by regression.This CANNOT be comparedto R Square for models which include an intercept.a.Predictors:Heightofwifeb.Dependent Variable:Heightofhusc.Linear Regression through the Origind.ANOVAANOVAc,dc,d991602.41991602.3671644
11、1.553.000a1869.6333160.311993472.0b32RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:Heightofwifea.This total sum of squares is not corrected for the constant because the constant iszero for regression through the origin.b.Dependent Variable:Heightofhusc.Linear Regression thro
12、ugh the Origind.C Co oe ef ff fi ic ci ie en nt ts sa a,b b1.061.008.999128.225.000HeightofwifeModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable:Heightofhusa.Linear Regression through the Originb.一元回归模型的建立一元回归模型的建立观察由n个样本 构成的散点图或计算样本相关系数,若呈现明显的相关性,建立数学模型 其
13、中 是未知参数,需要利用样本对它们进行估计.),(,),(),(2211nnyxyxyxxy10),0(2N210,散点图(散点图(1 1)xyxy10ixiyi参数参数 的最小二乘估计(的最小二乘估计(1 1)模型1 最小二乘解:10,),0(.,22110Ndi ixyniiiniiniiixxyyxxxy021110)()(矩阵偏导数与样本矩阵表达矩阵偏导数与样本矩阵表达nyyyY21nxxxX1112121n21AxxAxx2uxxu模型2 最小二乘解:(1)为y关于x的回归方程(2)称 为方程的回归系数()(3)称 为残差,为残差向量(4)称 为残差平方和),(),(22nnnnXN
14、YNXYYXXX1)(xy10),(10iiiyy)()(YYYYSEYYXY 参数参数 的最小二乘估计(的最小二乘估计(2 2)10,散点图(散点图(2 2)xyxy10 ixiyiy iiiiixyyy10 与与 的性质的性质 性质性质1 1 ES)(,(122 XXN 0)(,(2220 xxxNii )(1,(221 xxNi 1 00c11c 性质性质2 ,且 即 的无偏估计是性质性质3 3 与 相互独立 2ES22n2)2(nSEE2)2(2nSEES 性质性质4 4 若若 ,则,则 于是 的 置信区间是:iSii 2ntiicSi i)%1()2(,)2(22iiStStnini
15、 的样本标准差的样本标准差i一元回归模型的显著性一元回归模型的显著性决定系数法 回归方程的显著性检验 =决定系数法决定系数法 总平方和分解决定系数222)()()(iiiiyyyyyyERTSSS TETRSSSSR 12TESSnnRAdj2112 总平方和总平方和回归平方和回归平方和残差平方和残差平方和df df=n-1=n-1df df=n-2=n-2df df=1=1方差分析法方差分析法(回归方程的显著性检验回归方程的显著性检验)零假设检验统计量0:10 H含义?含义?)2(nSSFER)2,1(nF拒绝域(临界值法):)2,1(nF )2,1(nFFP)2,1(nFF 回归方程显著T
16、HANK YOUSUCCESS2022-12-555可编辑值法:()(2)RESP FpSnRESS(n-2)P0.05回归方程显著方差分析表(方差分析表(ANOVAANOVA)ModeldfSSMSFresidualTotalregression12 n1 nRSESTSRS)2(nSE)2(nSSER回归系数的显著性检验(回归系数的显著性检验(1 1)零假设检验统计量0:00 H含义?含义?00 ST 2 nt拒绝域(临界值法))2(2 nt)2(2 nt)2(2 ntT2)2(2 ntTP2)2(2 ntTP常数项显著值法00()P TSp00S00SP0.05回归系数显著回归系数的显著
17、性检验(回归系数的显著性检验(2 2)零假设检验统计量0:10 H11 St 2 nt2t)2,1(nF一元回归模型的诊断一元回归模型的诊断i前提假设前提假设 ),0(.2 Ndiii误差的估计误差的估计残差与残差图)(10iiiiixyyy ni,2,1iiy 残差图残差图(独立、等方差独立、等方差)残差图残差图 残残差差不不独独立立异异方方差差检验检验 的正态性的正态性(Q-QQ-Q图)图))(i),0(2 Nthni)2(2 nSE 的的分位数分位数理论分位数理论分位数样本分位数样本分位数Q-QQ-Q图图(Quantile-Quantile(Quantile-Quantile Plot)
18、Plot)(i)1()(n)1(nx)(nix)(nnx回归方程的显著性F检验回归系数的显著性t检验残差图-图参数估计误差估计多元回归模型的建立多元回归模型的建立模型 基本形式:样本表达:矩阵表达:ppxxxy22110),0(2 N ),0(.,22122110 Ndiixxxyniippiii),(),(22nnnnXNYNXY Model SummaryModel Summaryb b.965a.932.927433.56533Model1RR SquareAdjustedR SquareStd.Error ofthe EstimatePredictors:(Constant),新增固定
展开阅读全文