多元分析概述课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元分析概述课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 分析 概述 课件
- 资源描述:
-
1、第一章第一章 多元分析概述多元分析概述第一节第一节 引言引言 第二节第二节 应用背景应用背景 第三节第三节 计算机在统计分析中的应用计算机在统计分析中的应用 第一节第一节 引言引言 n多元统计分析多元统计分析是运用数理统计方法来研究解决是运用数理统计方法来研究解决多指标问题多指标问题的的理论和方法。理论和方法。近近3030年来,随着计算机应用技术的发展和科研生产的迫切需要,年来,随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于地质、气象、水文、医学、多元统计分析技术被广泛地应用于地质、气象、水文、医学、工业、农业和经济等许多领域,已经成为解决实际问题的有效工业、农业
2、和经济等许多领域,已经成为解决实际问题的有效方法。方法。n机遇与挑战机遇与挑战随着随着InternetInternet的日益普及,各行各业都开始采用计算机及相应的日益普及,各行各业都开始采用计算机及相应的信息技术进行管理和决策,这使得各企事业单位生成、收集、的信息技术进行管理和决策,这使得各企事业单位生成、收集、存储和处理数据的能力大大提高,数据量与日俱增,大量复杂存储和处理数据的能力大大提高,数据量与日俱增,大量复杂信息层出不穷。在信息爆炸的今天,人们已经意识到数据最值信息层出不穷。在信息爆炸的今天,人们已经意识到数据最值钱的时代已经到来。钱的时代已经到来。显然,大量数据在给人们带来方便的同
3、时也带来一系列问题。显然,大量数据在给人们带来方便的同时也带来一系列问题。n信息量过大,超过了人们掌握、消化的能力;信息量过大,超过了人们掌握、消化的能力;n一些信息真伪难辩,从而给信息的正确应用带来困难;一些信息真伪难辩,从而给信息的正确应用带来困难;n信息组织形式的不一致性导致难以对信息进行有效统一处信息组织形式的不一致性导致难以对信息进行有效统一处理理这种变化使传统的数据库技术和数据处理手段已经不能满足要这种变化使传统的数据库技术和数据处理手段已经不能满足要求求.网络的迅猛发展也使得网络上的各种资源信息异常丰富,网络的迅猛发展也使得网络上的各种资源信息异常丰富,在其中进行信息的查找如大海
4、捞针。这样又给多元统计分析理在其中进行信息的查找如大海捞针。这样又给多元统计分析理论的发展和方法的应用提出了新的挑战。论的发展和方法的应用提出了新的挑战。n多元统计分析发展的历史多元统计分析发展的历史起源于上世纪初,起源于上世纪初,19281928年年WishartWishart发表论文发表论文多元正态总体样多元正态总体样本协差阵的精确分布本协差阵的精确分布,可以说是多元分析的开端。,可以说是多元分析的开端。2020世纪世纪3030年代年代R.A.Fisher R.A.Fisher、H.HotellingH.Hotelling、S.N.RoyS.N.Roy、许宝騄许宝騄等人作了一系列的奠基性工
5、作。等人作了一系列的奠基性工作。2020世纪世纪4040年代在心理、教育、生物等方面有不少的应用,但由年代在心理、教育、生物等方面有不少的应用,但由于计算量大,使其发展受到影响,甚至停滞了相当长得时间。于计算量大,使其发展受到影响,甚至停滞了相当长得时间。2020世纪世纪5050年代中期,随着电子计算机的出现和发展,使多元分年代中期,随着电子计算机的出现和发展,使多元分析方法在地质、气象、医学、社会学等方面得到广泛得应用。析方法在地质、气象、医学、社会学等方面得到广泛得应用。2020世纪世纪6060年代通过应用和实践又完善和发展了理论,由于新的年代通过应用和实践又完善和发展了理论,由于新的理论
6、、新的方法不断涌现又促使它的应用范围更加扩大。理论、新的方法不断涌现又促使它的应用范围更加扩大。2020世纪世纪7070年代初期在我国才受到各个领域的极大关注,并在多年代初期在我国才受到各个领域的极大关注,并在多元统计分析的理论研究和应用上也取得了很多显著成绩,有些元统计分析的理论研究和应用上也取得了很多显著成绩,有些研究工作已达到国际水平,并已形成一支科技队伍,活跃在各研究工作已达到国际水平,并已形成一支科技队伍,活跃在各条战线上。条战线上。在在2020世纪末与本世纪初,人们获得的数据正以前所未有的速度世纪末与本世纪初,人们获得的数据正以前所未有的速度急剧增加,产生了很多超大型数据库,遍及超
7、级市场销售、银急剧增加,产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学以及政府统计等领域,行存款、天文学、粒子物理、化学、医学以及政府统计等领域,多元统计与人工智能和数据库技术相结合,已在经济、商业、多元统计与人工智能和数据库技术相结合,已在经济、商业、金融、天文等行业得到了成功的应用。金融、天文等行业得到了成功的应用。n本课程重点介绍多元正态总体的参数估计和假设检验以及常本课程重点介绍多元正态总体的参数估计和假设检验以及常用的统计方法。这些方法包括判别分析、聚类分析、主成分用的统计方法。这些方法包括判别分析、聚类分析、主成分分析、因子分析、相应分析、典型相关
8、分析、多维标度法以分析、因子分析、相应分析、典型相关分析、多维标度法以及多变量的可视化分析等。及多变量的可视化分析等。n我们将利用我们将利用SPSSSPSS统计软件来实现实证分析。统计软件来实现实证分析。n许宝騄(许宝騄(1910.09.01-1970.12.181910.09.01-1970.12.18),),字闲若,数学家,字闲若,数学家,19101910年出生于北京,原年出生于北京,原籍浙江杭州,祖父曾任苏州知府,父亲曾籍浙江杭州,祖父曾任苏州知府,父亲曾任两浙盐运使,系名门世家。任两浙盐运使,系名门世家。在中国开创了概率论、数理统计的教学与在中国开创了概率论、数理统计的教学与研究工作。
9、在奈曼皮尔逊理论、参数估研究工作。在奈曼皮尔逊理论、参数估计理论、多元分析、极限理论等方面取得计理论、多元分析、极限理论等方面取得卓越成就,是多元统计分析学科的开拓者卓越成就,是多元统计分析学科的开拓者之一。之一。n统计方法是科学研究的一种重要工具,其应用颇为广泛。特统计方法是科学研究的一种重要工具,其应用颇为广泛。特别地,多元统计分析方法常常被应用于自然科学、社会科学别地,多元统计分析方法常常被应用于自然科学、社会科学等领域的问题中。等领域的问题中。第二节第二节 应用背景应用背景一、统计学的生命力在于应用一、统计学的生命力在于应用(一)(一)统计学产生于应用统计学产生于应用n统计学的发展过程
10、中可以看出统计学产生于应用,在应用过统计学的发展过程中可以看出统计学产生于应用,在应用过程中发展,它的生命力在于应用。程中发展,它的生命力在于应用。n300300多年前,威廉多年前,威廉配第(配第(1623-16871623-1687)写的)写的政治算术政治算术,从其研究方法看,被认为是一本统计学著作。政治算术学派从其研究方法看,被认为是一本统计学著作。政治算术学派的统计学家将统计方法应用于各自熟悉和感兴趣的研究领域,的统计学家将统计方法应用于各自熟悉和感兴趣的研究领域,都还是把其应用对象当作肯定性事物之间的联系来进行研究都还是把其应用对象当作肯定性事物之间的联系来进行研究的。他们确信,事物现
11、象存在着简单明了的数量关系,需要的。他们确信,事物现象存在着简单明了的数量关系,需要用定性与定量的方法将这种关系用定性与定量的方法将这种关系(规律)揭示或描述。使人规律)揭示或描述。使人们能够更具体、真切地认识世界。们能够更具体、真切地认识世界。n数理统计学派的奠基人凯特勒在统计学中引入了概率论,把数理统计学派的奠基人凯特勒在统计学中引入了概率论,把它应用于自然界和社会的许多方面它应用于自然界和社会的许多方面.n 在应用中对发展统计方法贡献显著的当推生物统计学派的在应用中对发展统计方法贡献显著的当推生物统计学派的戈尔登(戈尔登(1822-19211822-1921)、皮尔逊()、皮尔逊(185
12、7-19361857-1936)和农业实验学)和农业实验学派的孟德尔(派的孟德尔(1822-18841822-1884)、戈塞特()、戈塞特(1876-19371876-1937)等。)等。戈尔登六年中测量了近万人的戈尔登六年中测量了近万人的“身高、体重、阔度、呼吸力、身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、色觉及个人的其他资拉力和压力、手击的速率、听力、视力、色觉及个人的其他资料料”。在探究这些数据内在联系的过程中提出了今天在自然科。在探究这些数据内在联系的过程中提出了今天在自然科学和社会科学领域中广泛应用的学和社会科学领域中广泛应用的“相关相关”思想。将大量数据加思想
13、。将大量数据加以综合描述和比较,从而能使他的遗传理论建立在比较精确的以综合描述和比较,从而能使他的遗传理论建立在比较精确的基础上,为统计学引入了基础上,为统计学引入了中位数、四分位数、分布、回归中位数、四分位数、分布、回归等极等极为重要的概念和方法。为重要的概念和方法。皮尔逊在检验他老师戈尔登的皮尔逊在检验他老师戈尔登的“祖先遗传法则祖先遗传法则”和自然选择中和自然选择中“淘汰淘汰”对器官的相关及变异的影响中,引入了对器官的相关及变异的影响中,引入了复相关复相关的概念的概念和方法。在讨论生物退化、反祖、遗传、随机交配等问题中,和方法。在讨论生物退化、反祖、遗传、随机交配等问题中,展开了回归与相
14、关的研究,并提出以展开了回归与相关的研究,并提出以卡方检验卡方检验作为曲线拟合优作为曲线拟合优度的一种度量的思想。度的一种度量的思想。农业实验学派的孟德尔和戈塞特同样是在尝试回答各自应用领农业实验学派的孟德尔和戈塞特同样是在尝试回答各自应用领域中出现的新要求、新课题的过程中,发展了统计思想和统计域中出现的新要求、新课题的过程中,发展了统计思想和统计分析方法。孟德尔及其后继者贝特森等人创建的遗传试验手段,分析方法。孟德尔及其后继者贝特森等人创建的遗传试验手段,比通过记录生命外部联系曲折反映事物内在本质的描述统计更比通过记录生命外部联系曲折反映事物内在本质的描述统计更加深刻。他们运用推断的理论与实
15、验的方法,通常只用小样本加深刻。他们运用推断的理论与实验的方法,通常只用小样本来处理。来处理。戈塞特戈塞特的的T T分布与小样本思想更是在由于分布与小样本思想更是在由于“有些实验有些实验不能多次地进行不能多次地进行”,从而,从而“必须根据极少数的事例(小样本)必须根据极少数的事例(小样本)来判断实验结果的正确性来判断实验结果的正确性”的情况下产生的。今天,这些统计的情况下产生的。今天,这些统计思想和分析推断方法已经成为了科学家们不可缺少的基本研究思想和分析推断方法已经成为了科学家们不可缺少的基本研究工具了。工具了。n近现代,统计学已经空前广泛应用于最高级的运动形式近现代,统计学已经空前广泛应用
16、于最高级的运动形式社会。其结果便是出现了一系列与其应用对象指导理论和其社会。其结果便是出现了一系列与其应用对象指导理论和其它相关学科交织在一起的边缘学科。如在社会经济方面的投它相关学科交织在一起的边缘学科。如在社会经济方面的投入产出经济学、经济计量学、统计预测学、统计决策学等等。入产出经济学、经济计量学、统计预测学、统计决策学等等。在这些边缘学科中,统计学与其应用对象结合更紧密、更自在这些边缘学科中,统计学与其应用对象结合更紧密、更自然。这些学科的专家学者至少在两个或两个以上的专业领域然。这些学科的专家学者至少在两个或两个以上的专业领域里有比较深厚的学术造诣。统计学的应用帮助他们在各自的里有比
17、较深厚的学术造诣。统计学的应用帮助他们在各自的应用领域中取得辉煌的成就。应用领域中取得辉煌的成就。n可见,统计学的发展一刻也离不开应用。它在应用中诞生,可见,统计学的发展一刻也离不开应用。它在应用中诞生,在应用中成熟、独立,在应用中扩充自身的方法内容,同时在应用中成熟、独立,在应用中扩充自身的方法内容,同时扩展了应用领域,又在应用中与其他学科紧密结合形成新的扩展了应用领域,又在应用中与其他学科紧密结合形成新的边缘学科。一部统计理论发展史同时又是一部应用统计发展边缘学科。一部统计理论发展史同时又是一部应用统计发展史,正因如此,统计学的生命力在于应用。史,正因如此,统计学的生命力在于应用。(二)(
18、二)理论研究为统计学的应用奠定了基础理论研究为统计学的应用奠定了基础n 统计理论问题的研究和应用研究从总体上说应该属于统计理论问题的研究和应用研究从总体上说应该属于“源源”和和“流流”的关系。如果理论不成熟,方法不完善,统计应用的关系。如果理论不成熟,方法不完善,统计应用研究也很难达到较高的水平。因此,充分发挥统计学的生命研究也很难达到较高的水平。因此,充分发挥统计学的生命力,必须建立在统计理论研究的基础之上。力,必须建立在统计理论研究的基础之上。n从国际上看,近十几年来,统计分析技术的研究有了新的发从国际上看,近十几年来,统计分析技术的研究有了新的发展。这些研究的总体特征是,广泛吸收和融合相
19、关学科的新展。这些研究的总体特征是,广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法研究,并拓展了统计研究的新领域。传统领域的理论与方法研究,并拓展了统计研究的新领域。n这些都充分地体现了统计学强有力的生命力,其具体表现在:这些都充分地体现了统计学强有力的生命力,其具体表现在:n第一,统计学为计算机科学的发展发挥作用。在计算机协助第一,统计学为计算机科学的发展发挥作用。在计算机协助的电子通讯、网络创新、资源及信息统计中的统计软件等方的电子通讯、网络创新、资源及信息统计中的统计软件等方面,对统计
20、信息搜集、存贮和传递中利用计算机提高工作效面,对统计信息搜集、存贮和传递中利用计算机提高工作效能,建立统计信息时空结构有了新的发展。在网络推断、统能,建立统计信息时空结构有了新的发展。在网络推断、统计软件包、统计建模中的计算机诊断方面,提出了统计思想计软件包、统计建模中的计算机诊断方面,提出了统计思想直接转化为计算机软件,通过软件对统计过程实行控制的作直接转化为计算机软件,通过软件对统计过程实行控制的作用,以及利用计算机程序识别模型、改善估计量性质的新方用,以及利用计算机程序识别模型、改善估计量性质的新方法。这些研究成果使人们兴奋地看到计算机技术正在促使统法。这些研究成果使人们兴奋地看到计算机
21、技术正在促使统计科研工作发生革命性变化。在软件的质量评估上及统计程计科研工作发生革命性变化。在软件的质量评估上及统计程序和方法在软件可靠性检验等方面也有了新的发展。序和方法在软件可靠性检验等方面也有了新的发展。n第二,统计理论与分析方法的新发展。近年来,统计方法成第二,统计理论与分析方法的新发展。近年来,统计方法成果丰硕,反映了统计理论与分析方法在不断的发展中趋于成果丰硕,反映了统计理论与分析方法在不断的发展中趋于成熟和完善。在贝叶斯方法、非线性时间序列、多元分析、统熟和完善。在贝叶斯方法、非线性时间序列、多元分析、统计计算、线性模型、稳健估计、极值统计、混沌理论及统计计计算、线性模型、稳健估
展开阅读全文