状态空间模型和卡尔曼滤波课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《状态空间模型和卡尔曼滤波课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 状态 空间 模型 卡尔 滤波 课件
- 资源描述:
-
1、1 60年代初,由于工程控制领域的需要,产生了卡尔曼滤年代初,由于工程控制领域的需要,产生了卡尔曼滤波波 (Kalman Filtering)。进入。进入70年代初,人们明确提出了状态年代初,人们明确提出了状态空间模型的标准形式,并开始将其应用到经济领域。空间模型的标准形式,并开始将其应用到经济领域。80年代年代以后,状态空间模型已成为一种有力的建模工具。以后,状态空间模型已成为一种有力的建模工具。许多时间许多时间序列模型,包括典型的线性回归模型和序列模型,包括典型的线性回归模型和ARIMA模型都能作为模型都能作为特例写成状态空间的形式,并估计参数值。在计量经济学文特例写成状态空间的形式,并估
2、计参数值。在计量经济学文献中,状态空间模型被用来估计不可观测的时间变量:理性献中,状态空间模型被用来估计不可观测的时间变量:理性预期,测量误差,长期收入,不可观测因素(趋势和循环要预期,测量误差,长期收入,不可观测因素(趋势和循环要素)。状态空间模型在经济计量学领域其他方面的大量应用素)。状态空间模型在经济计量学领域其他方面的大量应用请参见请参见 Harvey(1989)和)和 Hamilton(1994) 。 2 在一般的统计模型中出现的变量都是可以观测到的,在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映过去经济变动的时间序列数据为基础,利这些模型以反映过去经济变动的时间序列数
3、据为基础,利用回归分析或时间序列分析等方法估计参数,进而预测未用回归分析或时间序列分析等方法估计参数,进而预测未来的值。状态空间模型的特点是提出了来的值。状态空间模型的特点是提出了“”这一概念。这一概念。 而实际上,无论是工程控制问题中出现的某些状态而实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹的控制问题)还是经济系统所存在的某些状(如导弹轨迹的控制问题)还是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不到的变量反态都是一种不可观测的变量,正是这种观测不到的变量反映了系统所具有的真实状态,所以被称为映了系统所具有的真实状态,所以被称为。这种。这种(Unobservab
4、le Component Model)。3 UC模型通过通常的回归方程式来估计是不可能的,模型通过通常的回归方程式来估计是不可能的,必须利用状态空间模型来求解。必须利用状态空间模型来求解。,从而可以通过估,从而可以通过估计各种不同的状态向量达到分析和观测的目的。计各种不同的状态向量达到分析和观测的目的。 EViews状态空间对象对单方程或多方程动态系统提状态空间对象对单方程或多方程动态系统提供了一个直接的、易于使用的界面来建立、估计及分析供了一个直接的、易于使用的界面来建立、估计及分析方程结果。它提供了大量的建立、平滑、滤波及预测工方程结果。它提供了大量的建立、平滑、滤波及预测工具,帮助我们利
5、用状态空间形式来分析动态系统。具,帮助我们利用状态空间形式来分析动态系统。 4 利用状态空间形式表示动态系统主要有两个优点:利用状态空间形式表示动态系统主要有两个优点: 第一,状态空间模型将不可观测的变量第一,状态空间模型将不可观测的变量(状态变量状态变量)并入可观测模型并与其一起得到估计结果;并入可观测模型并与其一起得到估计结果; 其次,状态空间模型是利用强有效的递归算法其次,状态空间模型是利用强有效的递归算法来估计的。卡尔曼滤波可以用来估计单变量来估计的。卡尔曼滤波可以用来估计单变量和多变量的和多变量的ARMA模型模型、MIMIC(多指标和多因果)模(多指标和多因果)模型、马尔可夫转换模型
6、以及变参数模型。型、马尔可夫转换模型以及变参数模型。5678910111213 这里仅就如何定义并预测一个线性状态空间模型做以简这里仅就如何定义并预测一个线性状态空间模型做以简要的讨论。状态空间模型一般应用于多变量时间序列。设要的讨论。状态空间模型一般应用于多变量时间序列。设 yt 是包含是包含 k 个经济变量的个经济变量的 k 1 维可观测向量。这些变量与维可观测向量。这些变量与 m 1 维向量维向量 t 有关有关,。定义。定义“” (measurement equation) 或称或称“”(signal equation)为为(1.1)其中:其中:T 表示样本长度,表示样本长度, 表示表示
7、 k m 矩阵矩阵,称为称为,dt 表示表示 k 1 向量,向量,ut 表示表示 k 1 向量,是均值为向量,是均值为0,协方差矩,协方差矩阵为阵为 Ht 的不相关扰动项,即的不相关扰动项,即(1.2),tttttudZyTt,2, 1,tttEHuu)var(0)(14 一般地,一般地, t 的元素是不可观测的,然而可表示成一阶马的元素是不可观测的,然而可表示成一阶马尔可夫尔可夫(Markov)过程。下面定义过程。下面定义(transition equation)或称或称(state equation)为为 (1.3)其中:其中:表示表示 m m 矩阵矩阵,称为称为,ct 表示表示 m 1
8、向量向量,Rt 表示表示 m g 矩阵,矩阵, t 表示表示 g 1 向量,是均值为向量,是均值为0,协方差矩阵,协方差矩阵为为 Qt 的连续的不相关扰动项,即的连续的不相关扰动项,即(1.4)量测方程和状态方程的扰动项的协方差矩阵用量测方程和状态方程的扰动项的协方差矩阵用 表示表示,1ttttttRcTtttEQ)var(0)(Tt,2, 1,ttttQHu00var15 当当 k 1 时,变为单变量模型,量测方程可以写为时,变为单变量模型,量测方程可以写为 (1.5)其中:其中:Zt 表示表示 1 m 矩阵矩阵, t 表示表示 m 1状态向量,状态向量, ut 是方是方差为差为 2 的扰动
9、项的扰动项。tttttudyZTt,2, 12)var(tu16 若使上述的状态空间模型成立,还需要满足下面两个假定:若使上述的状态空间模型成立,还需要满足下面两个假定: (1) 初始状态向量初始状态向量 0 的均值为的均值为 a0,协方差矩阵为协方差矩阵为 P0,即即 (1.6) (2) 在所有的时间区间上,扰动项在所有的时间区间上,扰动项 ut 和和 t 相互独立,而且相互独立,而且它们和初始状态它们和初始状态 0 也不相关,即也不相关,即 (1.7)且且 (1.8) 0000)var()(P aE0)(stEuTts,2, 1,,0)(0utE0)(0tETt,2, 117 量测方程中的
10、矩阵量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵与转移方程中的矩阵Tt , ct , Rt , Qt 统称为统称为。如不特殊指出,它们都。如不特殊指出,它们都被假定为非随机的。因此,尽管它们能随时间改变,被假定为非随机的。因此,尽管它们能随时间改变,但是都是可以预先确定的。对于任一时刻但是都是可以预先确定的。对于任一时刻 t,yt 能够被能够被表示为当前的和过去的表示为当前的和过去的 ut 和和 t 及初始向量及初始向量 0 的线性组的线性组合,所以模型是线性的。合,所以模型是线性的。18 (1.9)其中:其中:E( t )=0,var( t)= 2,cov( t , t-s
11、)=0, 通过定义状态向量通过定义状态向量 t =( yt , t ) 可以写成状态空间形式可以写成状态空间形式 量测方程量测方程: (1.10) 状态方程状态方程: (1.11)这种形式的特点是不存在量测方程噪声这种形式的特点是不存在量测方程噪声。 ,1tttytty)0, 1 (ttt100101Tt,2, 119 对于任何特殊的统计模型,状态向量对于任何特殊的统计模型,状态向量 t 的定义是由的定义是由结构确定的。它的元素一般包含具有实际解释意义的成结构确定的。它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空间模型的目标是,所分,例如趋势或季节要素。状态空间模型的目标是
12、,所建立的状态向量建立的状态向量 t 包含了系统在时刻包含了系统在时刻 t 的所有有关信息,的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间模型的同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最小维数,则称为状态向量具有最小维数,则称为(Minimal Realization)。对一个好的状态空间模型,最小实现是一。对一个好的状态空间模型,最小实现是一个基本准则。然而对于任一特殊问题的状态空间模型的个基本准则。然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的,这一点很容易验证。表示形式却不是惟一的,这一点很容易验证。20 考虑通过定义一个任意的非奇异矩阵考虑通过
13、定义一个任意的非奇异矩阵B,得到得到 t*=B t ,为新的状态向量。用为新的状态向量。用B矩阵左乘状态方程矩阵左乘状态方程(1.3),得到,得到 (1.12)式中式中Tt* = BTt B-1,ct*= Bct ,Rt*= BRt 。相应的量测方程。相应的量测方程是是 (1.13)式中式中 Zt* = Zt B-1 。ttttttRcT1tttttudZy21例例1.2 二阶自回归模型二阶自回归模型AR(2) (1.14)其中:其中:E(ut) = 0,var(ut) = 2,cov(ut , ut-s) = 0, 考虑两个可能的考虑两个可能的状态空间形式状态空间形式( k=1, m=2 )
14、是是 (1.15) (1.16)换一种形式换一种形式 (1.17) ,ttttuyyy2211tttttuyy010112112tttttuyy01011211tty)0,1 ( tty)0,1 (Tt,2, 122 系统矩阵系统矩阵 Zt ,Ht ,Tt ,Rt ,Qt 可以依赖于一个可以依赖于一个的集合。状态空间模型的一个主要的任务就是估计这些参数,的集合。状态空间模型的一个主要的任务就是估计这些参数,在例在例11.1的的MA(1)模型中的参数模型中的参数 , 2 和例和例11.2的的AR(2)模型模型中的参数中的参数 1, 2, 2 是未知的,这些参数将通过是未知的,这些参数将通过 向量
15、向量表示,并被称为表示,并被称为。超参数确定了。超参数确定了模型的随机性质,在模型的随机性质,在 ct 和和 dt 中出现的参数仅影响确定性的可中出现的参数仅影响确定性的可观测变量和状态的期望值。在状态空间模型中可以引入外生观测变量和状态的期望值。在状态空间模型中可以引入外生变量作为解释变量,也可以引入变量作为解释变量,也可以引入 yt 的延迟变量,这些都可以的延迟变量,这些都可以放到放到 dt 中去。如果中去。如果 ct 或或 dt 是未知参数的一个线性函数,这些是未知参数的一个线性函数,这些未知参数也可以作为状态变量或者超参数的一部分元素。未知参数也可以作为状态变量或者超参数的一部分元素。
16、23 通常的回归模型可用下式表示,即通常的回归模型可用下式表示,即 :其中:其中:yt是因变量,是因变量,xt是是m 1的解释变量向量,的解释变量向量, 是待估计的是待估计的m 1未知参数向量,未知参数向量,ut是扰动项。这种回归方程式所估计的参数在是扰动项。这种回归方程式所估计的参数在样本期间内是固定的,可以采用普通最小二乘法样本期间内是固定的,可以采用普通最小二乘法(OLS)、工具、工具变量法等计量经济模型的常用方法进行估计。变量法等计量经济模型的常用方法进行估计。 ,tttuyxTt,2, 124 实际上近年来,我国由于经济改革、各种各样的外界冲击实际上近年来,我国由于经济改革、各种各样
17、的外界冲击和政策变化等因素的影响,经济结构正在逐渐发生变化,而用和政策变化等因素的影响,经济结构正在逐渐发生变化,而用固定参数模型表现不出来这种经济结构的变化,因此,需要考固定参数模型表现不出来这种经济结构的变化,因此,需要考虑采用虑采用(Time-varying Parameter Model)。下面利用。下面利用状态空间模型来构造变参数模型。状态空间模型来构造变参数模型。 量测方程:量测方程: 状态方程:状态方程: tttttuyzxttt1),(ttu ,00,002QNTt,2, 125 xt 是具有随机系数是具有随机系数 t 的解释变量的集合,的解释变量的集合,zt 是有固是有固定系
18、数定系数 的解释变量集合,随机系数向量的解释变量集合,随机系数向量 t 是对应于例是对应于例1.3中的状态向量,称为可变参数。中的状态向量,称为可变参数。假定变参数。假定变参数 t 的变动服从于的变动服从于AR(1) 模型(也可以简单地扩展为模型(也可以简单地扩展为AR(p) 模型),扰动向量模型),扰动向量 ut , t 假定为相互独立的,且服从均值假定为相互独立的,且服从均值为为0,方差为,方差为 2和协方差矩阵为和协方差矩阵为 Q 的正态分布。的正态分布。 2627 当一个模型被表示成状态空间形式就可以对其应用当一个模型被表示成状态空间形式就可以对其应用一些重要的算法求解。这些算法的核心
19、是一些重要的算法求解。这些算法的核心是Kalman滤波。滤波。Kalman滤波是在时刻滤波是在时刻 t 基于所有可得到的信息计算状态基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工程问题中,状态向量向量的最理想的递推过程。在某些工程问题中,状态向量的当前值具有重要影响的当前值具有重要影响 (例如,它可以表示火箭在空间的例如,它可以表示火箭在空间的坐标坐标)。Kalman滤波的主要作用是:当扰动项和初始状态滤波的主要作用是:当扰动项和初始状态向量服从正态分布时,能够通过预测误差分解计算似然函向量服从正态分布时,能够通过预测误差分解计算似然函数,从而可以对模型中的所有未知参数进行估计,
20、并且当数,从而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到,就可以利用新的观测值一旦得到,就可以利用Kalman滤波连续地修滤波连续地修正状态向量的估计。正状态向量的估计。282930 以下设以下设 YT 表示在表示在 t = T 时刻所有可利用的信息的信息时刻所有可利用的信息的信息集合,即集合,即 YT = yT , yT-1 , , y1 。状态向量的估计问题根。状态向量的估计问题根据信息的多少分为据信息的多少分为3种类型:种类型: (1) 当当 t T 时,超出样本的观测区间,是对未来状态时,超出样本的观测区间,是对未来状态的估计问题,称为的估计问题,称为; (2) 当当
21、 t = T 时,估计观测区间的最终时点,即对现在时,估计观测区间的最终时点,即对现在状态的估计问题,称为状态的估计问题,称为; (3) 当当 t T 时,是基于利用现在为止的观测值对过去时,是基于利用现在为止的观测值对过去状态的估计问题,称为状态的估计问题,称为。31 进一步,假定进一步,假定 at t-1 和和 Pt t-1 分别表示以利用到分别表示以利用到 t-1 为止为止的信息集合的信息集合 Yt-1 为条件的状态向量为条件的状态向量 t 的条件均值和条件误的条件均值和条件误差协方差矩阵,即差协方差矩阵,即 在这里假定系统矩阵在这里假定系统矩阵 Zt , Ht , Tt , Rt 和和
22、 Qt 是已知的,设是已知的,设初始状态向量初始状态向量 0 的均值和误差协方差矩阵的初值为的均值和误差协方差矩阵的初值为 a0 和和 P0,并假定,并假定 a0 和和 P0 也是已知的。也是已知的。 )(11ttttEYa)var(11ttttYP32 考虑状态空间模型考虑状态空间模型(1.1)和和(1.3),设,设 ,也是基于信息集合,也是基于信息集合 Yt-1 的的 t-1 的的,Pt-1 表示估计误差的表示估计误差的 m m 协方差矩阵,即协方差矩阵,即 (2.1)(11111tttttEaaP33 Kalman滤波的初值可以按滤波的初值可以按 a0 和和 P0 或或 a1 0 和和
23、P1 0 指指定。这样,每当得到一个观测值时,定。这样,每当得到一个观测值时,Kalman滤波提供了滤波提供了状态向量的最优估计。当所有的状态向量的最优估计。当所有的 T 个观测值都已处理,个观测值都已处理,Kalman滤波基于信息集合滤波基于信息集合 YT ,产生当前状态向量和下,产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量和未来观测值的最优预测所需的所有信息。未来状态向量和未来观测值的最优预测所需的所有信息。 34 平滑(平滑(smoothing)( t =T-1 , T-2 , , 1 ) (2.10)
24、(2.11)其中:其中:aT|T , PT|T 是平滑的初值,由是平滑的初值,由Kalman滤波最后的迭代滤波最后的迭代得到。得到。 还可以计算得到还可以计算得到 yt 的平滑估计和协方差矩阵的平滑估计和协方差矩阵)(| 11| 1|tt tTtttt tt tTtcTPTPaaaat tttttTtttt tt tTt|1| 1| 1| 11| 1|)(PTPPPPTPPPtTttTtdZyatTtttZPZS35 一步向前预测误差向量一步向前预测误差向量 (2.14) 预测误差协方差矩阵由式预测误差协方差矩阵由式(2.6)的的 Ft 给定,即给定,即 (2.15) 由后面由后面2.2节的论
25、述可以知道条件均值节的论述可以知道条件均值 是是 yt 的最小的最小均方误差意义的最优估计量均方误差意义的最优估计量(MMSE)。因此,可以利用式。因此,可以利用式(2.13),以及,以及Kalman滤波公式滤波公式(2.2)(2.6),对,对 yt , t(t = T+1 , T+2 , )进行预测。)进行预测。,1ttttyyvTt,2, 1,1ttttttHZPZFTt,2, 11tty36Kalman滤波的导出依赖于扰动项和初始状态向量服滤波的导出依赖于扰动项和初始状态向量服从正态分布的假设。有了正态分布的假设,就能够基于从正态分布的假设。有了正态分布的假设,就能够基于信息集合信息集合
展开阅读全文