气象统计方法第一章气象资料及其表示方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《气象统计方法第一章气象资料及其表示方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 气象 统计 方法 第一章 资料 及其 表示 课件
- 资源描述:
-
1、气象统计方法气象统计方法主讲:温 娜南京信息工程大学大气科学学院2015年3月本课件主要参考南信大李丽平老师课件 要求:要求:1、掌握气象上常用的一些统计方法,运用这些方法进行资料分析,在此基础上作一些简单的气候预测等2、了解其它方法在业务和科研中的应用,对后期学习起引导作用 气象统计方法:气象统计方法:利用统计方法对气象资料样本进行分析来估计和推测总体的规律性,为气象预报提供依据。 课时安排 总学时:48学时(1-16周) 讲授为主, 课堂练习 考核方式 平时成绩(出勤、课堂作业) 期末考试参考书目:参考书目:1、李湘阁等气象统计方法,2、黄嘉佑著气象统计分析与预报方法,气象出版社,2004
2、.33、施能著气象统计预报,气象出版社,2009.114、吴洪宝等著气候变率诊断和预测方法,气象出版社,2010.65、魏凤英著现代气候统计诊断与预测技术,气象出版社,2009.9教学内容教学内容第一章第一章 气象资料及其表示方法气象资料及其表示方法第二章第二章 气候稳定性检验气候稳定性检验第三章第三章 选择最大信息的预报因子选择最大信息的预报因子第四章第四章 一元线性回归分析一元线性回归分析第五章第五章 多元线性回归分析多元线性回归分析第六章第六章 气候趋势分析气候趋势分析第七章第七章 主分量分析主分量分析第八章 聚类分析1. 气象要素气象要素 大气温度、压力、空气湿度、风向和风速、降水、云
3、、雾、雷暴、辐射、能见度等 还有土壤、陆面植被、海洋等监测要素一、气象资料(研究对象)一、气象资料(研究对象)2. 气象监测全球监测系统全球监测系统ARGO计划气象监测意义:1. 记录天气、气候的实际情况2. 了解气候的基本状况3. 分析研究气候变化规律4. 气候预测(第一张天气图的诞生)(第一张天气图的诞生)拉萨站(29N, 91E)气温观测数据江苏省(116-122E,30-36N)月平均气温数据(1958-2007)江苏省(116-122E,30-36N)月平均气温数据(1958-2007) 气象中单个或多个要素可看成为统计学气象中单个或多个要素可看成为统计学中单个或多个变量。中单个或多
4、个变量。二、气象资料的表示二、气象资料的表示第一节第一节 单个要素的气象资料单个要素的气象资料1 1、数据的表示:数据的表示: 某要素x有n 次观测值,其向量表达形式为或者 n 样本容量 时间序列概念时间序列概念 数据是随时间变化的序列,习惯称为时间序列。数据是随时间变化的序列,习惯称为时间序列。例如:例如:取某要素月平均值的取某要素月平均值的n n年资料年资料 几何意义:几何意义: (1 1)n n 维空间中的一个点维空间中的一个点 (2 2)一维空间(单坐标)中的)一维空间(单坐标)中的n n个点个点 举例:举例: 1.某站点1958至2007年的气温 2.某站点1960至2010年一月份
5、的气温 3.某站点某时段冬季/夏季降水 要素样本中资料分布的特点要素样本中资料分布的特点-用一些统计量用一些统计量表征。表征。 1 1)平均值平均值 含义:平均值是要素总体数学期望的一个估计。含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。反映了该要素的平均(气候)状况。平均值概念在气象上的应用:平均值概念在气象上的应用: 气象上的月平均气温、年平均气温及某要素多气象上的月平均气温、年平均气温及某要素多年平均值就是这种统计量。年平均值就是这种统计量。例如:某地气候状态 (对于逐月资料,一般分别求各月多年的平均值,所以会有12个月平均值场;逐日资料也是类似)。 气象研究
6、中,不同时间分辨率气象资料的使用(逐日资料、月资料、年资料等) 举例: 江苏气候?江苏省1958-2007年月平均气温江苏省各月气温平均值(气候态)江苏省1958-2007年冬季月平均气温 2 2)距平)距平 含义:含义:反映数据偏离平均值的状况反映数据偏离平均值的状况 ,也是通常所,也是通常所说的说的异常异常。 距平序列距平序列:单要素样本中每个样本资料点的距平:单要素样本中每个样本资料点的距平值组成的序列称为距平序列,也可以记为距平向值组成的序列称为距平序列,也可以记为距平向量。量。气象上的应用:气象上的应用: 中心化的概念:中心化的概念: 把资料处理为距平的方法叫把资料处理为距平的方法叫
7、中心化。中心化。 气象上常用距平值代替原样本中的资料值作气象上常用距平值代替原样本中的资料值作为研究对象。为研究对象。中心化的必要性:中心化的必要性: 因为气象要素的年变化周期影响很大,各月因为气象要素的年变化周期影响很大,各月的平均值不一样,为了使之能在同一水平下比较,的平均值不一样,为了使之能在同一水平下比较,常使用距平值(比如之前的举例)。常使用距平值(比如之前的举例)。特性:特性:距平值的平均值为距平值的平均值为0 0,使用方便;,使用方便; 直接作为预报值,比较直观(偏高直接作为预报值,比较直观(偏高/ /偏偏 低)。低)。 举例:举例: 某地气温的变化情况? (气温偏高、偏低是相对
8、于它的平均值而言)江苏省冬季气温的异常(1958-2007)如何正确计算异常场?不可取江苏省气温异常(1958-2007)3 3)方差和均方差(标准差)方差和均方差(标准差) 对气象要素对气象要素x,x,资料长度资料长度n,n,其表达式:其表达式: 含义:含义: 是均方差(标准差),描述样本中资料与平均是均方差(标准差),描述样本中资料与平均值差异的值差异的平均平均状况,反映变量围绕平均值的状况,反映变量围绕平均值的平均平均变化程度变化程度(离散程度),(离散程度), 是方差。是方差。方方 差差向量表示形式:气象上的应用:气象上的应用: 1)1)如果如果1212月份气温标准差比月份气温标准差比
9、1 1月份大,反映了月份大,反映了1212月份气温随时间变化幅度比月份气温随时间变化幅度比1 1月大。月大。 2)2)对于同一个月(例如对于同一个月(例如1212月),月),如果南京气如果南京气温的标准差比温的标准差比拉萨小拉萨小,表表明明拉萨冬季气温的变化拉萨冬季气温的变化幅度比较大。幅度比较大。 ( (内陆日变化较沿海大内陆日变化较沿海大, ,这个日变化大小的比较使这个日变化大小的比较使用的是标准差的比较用的是标准差的比较) )江苏省各月气温标准差3 3)均方差小的要素预报比大的困难还是容易?)均方差小的要素预报比大的困难还是容易?原因?原因?4 4)变量减去某常数后均方差相同。)变量减去
10、某常数后均方差相同。5)标准差与变量值同量纲,)标准差与变量值同量纲,一般用标准差表一般用标准差表示变量取值变化的大小。示变量取值变化的大小。 对气象要素对气象要素x,x,资料长度资料长度n,n,其表达式:其表达式: 特征:特征:1 1)标准化变量的平均值为)标准化变量的平均值为0 0。 2 2)标准化变量的方差为)标准化变量的方差为1 1。1 2,tztxxxxtnS, 为何要进行标准化为何要进行标准化? 各要素各要素单位不同单位不同、平均值平均值和和标准差标准差也也不同。为使它们在同一水平上比较,采用不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单标准化方法,使它们
11、变成同一水平的无单位的变量位的变量-标准化变量标准化变量。江苏省气温异常及其标准化降水距平百分率降水距平百分率距平距平/ /平均值平均值* *100%100%1 1)计算降水距平,即观测值减去平均值)计算降水距平,即观测值减去平均值2 2)1 1步骤所得结果除以该平均值,乘以步骤所得结果除以该平均值,乘以100100 ,即为降水距平百分比,即为降水距平百分比注意:注意:当观测值序列时间比较长,超过当观测值序列时间比较长,超过3030年,可以年,可以选择选择1980198020092009的平均值,作为步骤的平均值,作为步骤1 1中的平均值中的平均值4 4) 1 1)意义:)意义: 说明变量值变
12、化的大小。说明变量值变化的大小。2 2)变率)变率 绝对变率绝对变率:距平绝对值的平均。:距平绝对值的平均。 相对变率:相对变率: 绝对变率与平均值之比绝对变率与平均值之比11naiiVxxnarVVx3 3)变差系数)变差系数 标准差与平均值之比(标准差与平均值之比(% %) 表示变量的相对变化,表示变量的相对变化, 2111nxpiiSVxxxxn( - ) 注意:注意: 绝对变率和标准差的数量级与变量平均绝对变率和标准差的数量级与变量平均值的量级有关。值的量级有关。 有些同类型变量,彼此之间有些同类型变量,彼此之间平均值差别平均值差别大大,若要比较它们的变化性用绝对变率和,若要比较它们的
13、变化性用绝对变率和标准差不恰当,应当利用标准差不恰当,应当利用相对变率相对变率或或变差变差系数系数。5 5)频率分布频率分布 累积频率概念的引入:累积频率概念的引入: 平均值和均方差相同,但取值很大区别,区别其平均值和均方差相同,但取值很大区别,区别其特征,就需要引入新的统计量特征,就需要引入新的统计量-累积频率累积频率。 累积频率累积频率:变量小于某上限的次数与:变量小于某上限的次数与总次数之比。(总次数之比。(样本特征样本特征直方图直方图) 总体总体( (母体母体) ):统计分析对象的全体。统计分析对象的全体。 样本:样本:总体中的一部分。总体中的一部分。三、总体和样本三、总体和样本理解与
14、应用:理解与应用:总体的特征是总体的特征是客观客观存在的存在的样本的特征样本的特征随样本而变随样本而变,与其有关,与其有关 的变量均称为随机变量,如平的变量均称为随机变量,如平 均值、均方差等均值、均方差等选取选取有代表性有代表性的样本很重要的样本很重要样本量样本量n=30,n=30,根据数理统计中的大数定理推断得根据数理统计中的大数定理推断得到。到。气象上的总体指无限总体,一组气象资料就是无气象上的总体指无限总体,一组气象资料就是无限总体的样本。总体与样本关系的相对性。限总体的样本。总体与样本关系的相对性。大数定律大数定律 大数定律又称大数法则、大数率。大数定律又称大数法则、大数率。 在一个
15、随机事在一个随机事件中,随着件中,随着试验次数的增加试验次数的增加,事件,事件发生的频率趋发生的频率趋于一个稳定值于一个稳定值;同时,在对物理量的测量实践中,;同时,在对物理量的测量实践中,大量测定值的大量测定值的算术平均也具有稳定性算术平均也具有稳定性。在数理统。在数理统计中,根据计中,根据贝努利定理贝努利定理 辛钦定理辛钦定理:当当n n很大时,很大时,算术平均值接近数学期望;算术平均值接近数学期望;频率以概率收敛于事频率以概率收敛于事件的概率。件的概率。1 1)分布函数)分布函数 无限无限总体总体的累积频率的累积频率 称为概率密度函数,其最常见的形式是称为概率密度函数,其最常见的形式是正
16、态分布正态分布 和和 分别是总体平均值(期望)和标准分别是总体平均值(期望)和标准差,可以用样本平均值和均方差去估计。差,可以用样本平均值和均方差去估计。, xdxxfxPxF)()()()(xf222)(21)(xexf正态分布曲线 标准化变量的平均值为标准化变量的平均值为0 0、方差为方差为1 1。特点特点:1)标准化正态分布随机变量的绝对值大于2.58(1.96)的概率仅为0.01(0.05) 2)不同要素变量作图 3)标准化变量值的取值范围(+/-3之间),大于3的概率仅为0.0027 世界气象组织(WMO)旱涝年确定标准:距平达到或者大于2倍均方差,出现概率不到5%年份。 江苏省月平
17、均气温标准化数据P(|T|=2)=0.0483; P(|T|=3)=0.005 江苏省冬季气温数据分布图2 2)正态分布的统计检验)正态分布的统计检验 大多数气候诊断方法和预测模型是在气候变量呈正态分布假定前提下进行的,所以对气候变量是否呈正态分布形态的检验是十分必要的。正态分布检验不仅可以判断原始变量是否遵从正态分布,还可以检验那些原本不遵从正态分布,但经过数学变换后的变量是否已成为正态分布形式。(1 1)概念概念 峰度系数峰度系数与与偏度系数偏度系数是用来衡量随机变量概是用来衡量随机变量概率密度分布曲线形状的数字特征,描述了气候变率密度分布曲线形状的数字特征,描述了气候变量的分布特征。量的
18、分布特征。 偏度系数偏度系数:表征曲线峰点对期望值(平均值):表征曲线峰点对期望值(平均值)偏离的程度。偏离的程度。 峰度系数峰度系数:表征曲线分布形态顶峰的凸平度:表征曲线分布形态顶峰的凸平度(即渐进于横轴的陡度)。(即渐进于横轴的陡度)。(2)标准偏度系数和峰度系数的计算公式为:)标准偏度系数和峰度系数的计算公式为:其中,其中, 和和 s 分别为样本均值和标准差。分别为样本均值和标准差。xg2= g1= 偏度系数:偏度系数: 峰度系数:峰度系数: 标准偏度系数的意义标准偏度系数的意义测量数据分布的不对称性情况,测量数据分布的不对称性情况,刻画以平均值为中心的偏向情况,刻画以平均值为中心的偏
19、向情况,g g101010,表示正偏,即均值在峰值的右边;,表示正偏,即均值在峰值的右边;g g1=01=0,表示对称分布,表示对称分布 标准峰度系数的意义标准峰度系数的意义测量分布图像坡度的缓急程度g20, 表明图形坡度偏陡若若g1=0, g2=0g1=0, g2=0时,表明研究变量为理想的正态分布变量时,表明研究变量为理想的正态分布变量(3)显著性检验)显著性检验(4 4)资料的正态化资料的正态化 1 1、正态化的必要性、正态化的必要性 各类统计预报模型和统计检验方法各类统计预报模型和统计检验方法(Ftu (Ftu 检验检验) )要求资料是符合正态分布。要求资料是符合正态分布。 年年 月平
20、均气温月平均气温 气压气压 多雨地区的月降水多雨地区的月降水量符合量符合! ! 日降水日降水和和少雨地区月降水少雨地区月降水通常偏态。旬通常偏态。旬 候降水不一定候降水不一定! !2 2 2、资料正态化处理方法、资料正态化处理方法 1.立方根或四次方根; 2.双曲正切转换(纠正课本公式)-旬降水; 3.化为有序数后的正态化转换(标准化和正态化)。 江苏省全年月降水数据分布图 *也可以理解为同一要素多个格点也可以理解为同一要素多个格点(站点)的资料,下面慢慢体会。(站点)的资料,下面慢慢体会。 多个气象要素的样本如何表示?多个气象要素的样本如何表示?-矩阵矩阵。 设有设有m m个气象要素,每个要
21、素有个气象要素,每个要素有n n次观测值,次观测值,则数据矩阵为:则数据矩阵为:(2.1)11121212221212()mmnmmnnnmxxxxxxxxxXx xx第第t t个样本的资料向量为个样本的资料向量为nt, 2 , 1(2.2)123()tttmtx x xxtx两个方面来研究问题两个方面来研究问题( () )“R R型分析型分析”:研究不同要素或变量研究不同要素或变量( (如同一如同一 要素不同格点之间)的关系。(列)要素不同格点之间)的关系。(列)“Q Q型分析型分析”:研究样本之间的关系(行)。研究样本之间的关系(行)。1 1、n n维空间中的维空间中的 m m个点(列)个
22、点(列) m m个变量(格点、站点)确定了个变量(格点、站点)确定了n n维空间中的维空间中的 m m个点;个点; 用来研究变量(或者不同格点、站点)之间的关系。用来研究变量(或者不同格点、站点)之间的关系。-相关关系,如两个变量之间的相关系数相关关系,如两个变量之间的相关系数2 2、m m维空间中的维空间中的n n个点(行)个点(行)-空间点聚图空间点聚图 一个样本对应一个样本对应m m维空间中的一个点维空间中的一个点; 分析样本之间的关系时用到,如寻找相似个例。分析样本之间的关系时用到,如寻找相似个例。三、均值向量三、均值向量 m m个变量的样本平均值组成的向量。个变量的样本平均值组成的向
23、量。 m m维空间中的维空间中的n n个点的个点的重心重心(各部分受到的(各部分受到的重力作用集中于一点,这一点就是重心重力作用集中于一点,这一点就是重心 )。)。 12()mx xxxntitixn11xmi, 2 , 1(2.3) 多年平均多年平均1月气温月气温(19712010年)年) 多年平均多年平均7月气温月气温(19712010年)年) 多年平均多年平均1月降水量月降水量(19712010年)年) 多年平均多年平均7月降水量月降水量(19712010年)年)四四、距平向量距平向量1112121222d1d2dm12()ddd mddd mddndndnmxxxxxxxxxXxxx(
24、1,2,1,2,)dijijjxxxin jm,其表达式为其表达式为:1.1.协方差协方差 衡量任意两个气象要素(变量)之间衡量任意两个气象要素(变量)之间关系的统计量关系的统计量( (正、负相关关系正、负相关关系) ),另外一,另外一个统计量叫相关系数(以后讲解)。个统计量叫相关系数(以后讲解)。表达式:表达式:)( )(11jjtntiitijxxxxnsjintjtitxxxxn11mji, 2 , 1,(2.4)距平的内积距平的内积协方差气象意义的进一步理解:协方差气象意义的进一步理解: 1)反映了两个气象要素异常关系)反映了两个气象要素异常关系的平均状况,或的平均状况,或者两个变量的
展开阅读全文