状态空间模型和卡尔曼滤波课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《状态空间模型和卡尔曼滤波课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 状态 空间 模型 卡尔 滤波 课件
- 资源描述:
-
1、10状态空间模型和卡尔曼状态空间模型和卡尔曼滤波滤波 在一般的统计模型中出现的变量都是可以观测到的,在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映过去经济变动的时间序列数据为基础,利这些模型以反映过去经济变动的时间序列数据为基础,利用回归分析或时间序列分析等方法估计参数,进而预测未用回归分析或时间序列分析等方法估计参数,进而预测未来的值。状态空间模型的特点是提出了来的值。状态空间模型的特点是提出了“”这一概念。这一概念。而实际上,无论是工程控制问题中出现的某些状态而实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹的控制问题)还是经济系统所存在的某些状(如导弹轨迹的控制问题)
2、还是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不到的变量反态都是一种不可观测的变量,正是这种观测不到的变量反映了系统所具有的真实状态,所以被称为映了系统所具有的真实状态,所以被称为。这种。这种(Unobservable Component Model)。2 UC模型通过通常的回归方程式来估计是不可能的,模型通过通常的回归方程式来估计是不可能的,必须利用状态空间模型来求解。必须利用状态空间模型来求解。,从而可以通过估,从而可以通过估计各种不同的状态向量达到分析和观测的目的。计各种不同的状态向量达到分析和观测的目的。EViews状态空间对象对单方程或多方程动态系统提状态空间对象对
3、单方程或多方程动态系统提供了一个直接的、易于使用的界面来建立、估计及分析供了一个直接的、易于使用的界面来建立、估计及分析方程结果。它提供了大量的建立、平滑、滤波及预测工方程结果。它提供了大量的建立、平滑、滤波及预测工具,帮助我们利用状态空间形式来分析动态系统。具,帮助我们利用状态空间形式来分析动态系统。3 利用状态空间形式表示动态系统主要有两个优点:利用状态空间形式表示动态系统主要有两个优点:第一,状态空间模型将不可观测的变量第一,状态空间模型将不可观测的变量(状态变量状态变量)并入可观测模型并与其一起得到估计结果;并入可观测模型并与其一起得到估计结果;其次,状态空间模型是利用强有效的递归算法
4、其次,状态空间模型是利用强有效的递归算法来估计的。卡尔曼滤波可以用来估计单变量来估计的。卡尔曼滤波可以用来估计单变量和多变量的和多变量的ARMA模型模型、MIMIC(多指标和多因果)模(多指标和多因果)模型、马尔可夫转换模型以及变参数模型。型、马尔可夫转换模型以及变参数模型。456789101112 这里仅就如何定义并预测一个线性状态空间模型做以这里仅就如何定义并预测一个线性状态空间模型做以简要的讨论。状态空间模型一般应用于多变量时间序列。设简要的讨论。状态空间模型一般应用于多变量时间序列。设 yt 是包含是包含 k 个经济变量的个经济变量的 k 1 维可观测向量。这些变量与维可观测向量。这些
5、变量与 m 1 维向量维向量 t 有关有关,。定义。定义“”(measurement equation)或称或称“”(signal equation)为为(1.1)其中:其中:T 表示样本长度,表示样本长度,表示表示 k m 矩阵矩阵,称为称为,dt 表示表示 k 1 向量,向量,ut 表示表示 k 1 向量,是均值为向量,是均值为0,协方差矩,协方差矩阵为阵为 Ht 的不相关扰动项,即的不相关扰动项,即(1.2)13 一般地,一般地,t 的元素是不可观测的,然而可表示成一阶马的元素是不可观测的,然而可表示成一阶马尔可夫尔可夫(Markov)过程。下面定义过程。下面定义(transition
6、equation)或称或称(state equation)为为(1.3)其中:其中:表示表示 m m 矩阵矩阵,称为称为,ct 表示表示 m 1 向量向量,Rt 表示表示 m g 矩阵,矩阵,t 表示表示 g 1 向量,是均值为向量,是均值为0,协方差矩阵,协方差矩阵为为 Qt 的连续的不相关扰动项,即的连续的不相关扰动项,即(1.4)量测方程和状态方程的扰动项的协方差矩阵用量测方程和状态方程的扰动项的协方差矩阵用 表示表示14 当当 k 1 时,变为单变量模型,量测方程可以写为时,变为单变量模型,量测方程可以写为 (1.5)其中:其中:Zt 表示表示 1 m 矩阵矩阵,t 表示表示 m 1状
7、态向量,状态向量,ut 是方是方差为差为 2 的扰动项的扰动项。15 若使上述的状态空间模型成立,还需要满足下面两个假定:若使上述的状态空间模型成立,还需要满足下面两个假定:(1)初始状态向量初始状态向量 0 的均值为的均值为 a0,协方差矩阵为协方差矩阵为 P0,即即 (1.6)(2)在所有的时间区间上,扰动项在所有的时间区间上,扰动项 ut 和和 t 相互独立,而且相互独立,而且它们和初始状态它们和初始状态 0 也不相关,即也不相关,即 (1.7)且且 (1.8)16 量测方程中的矩阵量测方程中的矩阵 Zt,dt,Ht 与转移方程中的矩阵与转移方程中的矩阵Tt,ct,Rt,Qt 统称为统称
8、为。如不特殊指出,它们都。如不特殊指出,它们都被假定为非随机的。因此,尽管它们能随时间改变,被假定为非随机的。因此,尽管它们能随时间改变,但是都是可以预先确定的。对于任一时刻但是都是可以预先确定的。对于任一时刻 t,yt 能够被能够被表示为当前的和过去的表示为当前的和过去的 ut 和和 t 及初始向量及初始向量 0 的线性组的线性组合,所以模型是线性的。合,所以模型是线性的。17 (1.9)其中:其中:E(t)=0,var(t)=2,cov(t,t-s)=0,通过定义状态向量通过定义状态向量 t=(yt,t)可以写成状态空间形式可以写成状态空间形式 量测方程量测方程:(1.10)状态方程状态方
9、程:(1.11)这种形式的特点是不存在量测方程噪声这种形式的特点是不存在量测方程噪声。18 对于任何特殊的统计模型,状态向量对于任何特殊的统计模型,状态向量 t 的定义是的定义是由结构确定的。它的元素一般包含具有实际解释意义的由结构确定的。它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空间模型的目标是,成分,例如趋势或季节要素。状态空间模型的目标是,所建立的状态向量所建立的状态向量 t 包含了系统在时刻包含了系统在时刻 t 的所有有关信的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间模息,同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最小维数,则称为型
10、的状态向量具有最小维数,则称为(Minimal Realization)。对一个好的状态空间模型,最小实现是一。对一个好的状态空间模型,最小实现是一个基本准则。然而对于任一特殊问题的状态空间模型的个基本准则。然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的,这一点很容易验证。表示形式却不是惟一的,这一点很容易验证。19 考虑通过定义一个任意的非奇异矩阵考虑通过定义一个任意的非奇异矩阵B,得到得到 t*=B t ,为新的状态向量。用为新的状态向量。用B矩阵左乘状态方程矩阵左乘状态方程(1.3),得到,得到 (1.12)式中式中Tt*=BTt B-1,ct*=Bct,Rt*=BRt。相应的
11、量测方程。相应的量测方程是是 (1.13)式中式中 Zt*=Zt B-1 。20例例1.2 二阶自回归模型二阶自回归模型AR(2)(1.14)其中:其中:E(ut)=0,var(ut)=2,cov(ut,ut-s)=0,考虑两个可能的考虑两个可能的状态空间形式状态空间形式(k=1,m=2)是是 (1.15)(1.16)换一种形式换一种形式 (1.17)21 系统矩阵系统矩阵 Zt,Ht,Tt,Rt,Qt 可以依赖于一个可以依赖于一个的集合。状态空间模型的一个主要的任务就是估计这些参的集合。状态空间模型的一个主要的任务就是估计这些参数,在例数,在例11.1的的MA(1)模型中的参数模型中的参数
12、,2 和例和例11.2的的AR(2)模型中的参数模型中的参数 1,2,2 是未知的,这些参数将通过是未知的,这些参数将通过 向量表示,并被称为向量表示,并被称为。超参数确。超参数确定了模型的随机性质,在定了模型的随机性质,在 ct 和和 dt 中出现的参数仅影响确定性中出现的参数仅影响确定性的可观测变量和状态的期望值。在状态空间模型中可以引入的可观测变量和状态的期望值。在状态空间模型中可以引入外生变量作为解释变量,也可以引入外生变量作为解释变量,也可以引入 yt 的延迟变量,这些都的延迟变量,这些都可以放到可以放到 dt 中去。如果中去。如果 ct 或或 dt 是未知参数的一个线性函数,是未知
13、参数的一个线性函数,这些未知参数也可以作为状态变量或者超参数的一部分元素。这些未知参数也可以作为状态变量或者超参数的一部分元素。22 通常的回归模型可用下式表示,即通常的回归模型可用下式表示,即:其中:其中:yt是因变量,是因变量,xt是是m 1的解释变量向量,的解释变量向量,是待估计的是待估计的m 1未知参数向量,未知参数向量,ut是扰动项。这种回归方程式所估计的参是扰动项。这种回归方程式所估计的参数在样本期间内是固定的,可以采用普通最小二乘法数在样本期间内是固定的,可以采用普通最小二乘法(OLS)、工具变量法等计量经济模型的常用方法进行估计。工具变量法等计量经济模型的常用方法进行估计。23
14、 实际上近年来,我国由于经济改革、各种各样的外界冲击实际上近年来,我国由于经济改革、各种各样的外界冲击和政策变化等因素的影响,经济结构正在逐渐发生变化,而用和政策变化等因素的影响,经济结构正在逐渐发生变化,而用固定参数模型表现不出来这种经济结构的变化,因此,需要考固定参数模型表现不出来这种经济结构的变化,因此,需要考虑采用虑采用(Time-varying Parameter Model)。下面利用。下面利用状态空间模型来构造变参数模型。状态空间模型来构造变参数模型。量测方程:量测方程:状态方程:状态方程:24 xt 是具有随机系数是具有随机系数 t 的解释变量的集合,的解释变量的集合,zt 是
15、有固是有固定系数定系数 的解释变量集合,随机系数向量的解释变量集合,随机系数向量 t 是对应于例是对应于例1.3中的状态向量,称为可变参数。中的状态向量,称为可变参数。假定变参数。假定变参数 t 的变动服从于的变动服从于AR(1)模型(也可以简单地扩展为模型(也可以简单地扩展为AR(p)模型),扰动向量模型),扰动向量 ut,t 假定为相互独立的,且服从均值假定为相互独立的,且服从均值为为0,方差为,方差为 2和协方差矩阵为和协方差矩阵为 Q 的正态分布。的正态分布。2526 当一个模型被表示成状态空间形式就可以对其应用当一个模型被表示成状态空间形式就可以对其应用一些重要的算法求解。这些算法的
16、核心是一些重要的算法求解。这些算法的核心是Kalman滤波。滤波。Kalman滤波是在时刻滤波是在时刻 t 基于所有可得到的信息计算状态基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工程问题中,状态向量向量的最理想的递推过程。在某些工程问题中,状态向量的当前值具有重要影响的当前值具有重要影响(例如,它可以表示火箭在空间的例如,它可以表示火箭在空间的坐标坐标)。Kalman滤波的主要作用是:当扰动项和初始状态滤波的主要作用是:当扰动项和初始状态向量服从正态分布时,能够通过预测误差分解计算似然函向量服从正态分布时,能够通过预测误差分解计算似然函数,从而可以对模型中的所有未知参数进行估计
17、,并且当数,从而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到,就可以利用新的观测值一旦得到,就可以利用Kalman滤波连续地修滤波连续地修正状态向量的估计。正状态向量的估计。272829 以下设以下设 YT 表示在表示在 t=T 时刻所有可利用的信息的信息时刻所有可利用的信息的信息集合,即集合,即 YT=yT,yT-1,y1 。状态向量的估计问题根。状态向量的估计问题根据信息的多少分为据信息的多少分为3种类型:种类型:(1)当当 t T 时,超出样本的观测区间,是对未来状态时,超出样本的观测区间,是对未来状态的估计问题,称为的估计问题,称为;(2)当当 t=T 时,估计观测区间
18、的最终时点,即对现在时,估计观测区间的最终时点,即对现在状态的估计问题,称为状态的估计问题,称为;(3)当当 t T 时,是基于利用现在为止的观测值对过去时,是基于利用现在为止的观测值对过去状态的估计问题,称为状态的估计问题,称为。30 进一步,假定进一步,假定 at t-1 和和 Pt t-1 分别表示以利用到分别表示以利用到 t-1 为止为止的信息集合的信息集合 Yt-1 为条件的状态向量为条件的状态向量 t 的条件均值和条件误的条件均值和条件误差协方差矩阵,即差协方差矩阵,即 在这里假定系统矩阵在这里假定系统矩阵 Zt,Ht,Tt,Rt 和和 Qt 是已知的,设是已知的,设初始状态向量初
19、始状态向量 0 的均值和误差协方差矩阵的初值为的均值和误差协方差矩阵的初值为 a0 和和 P0,并假定,并假定 a0 和和 P0 也是已知的。也是已知的。31 考虑状态空间模型考虑状态空间模型(1.1)和和(1.3),设,设,也是基于信息集合,也是基于信息集合 Yt-1 的的 t-1 的的,Pt-1 表示估计误差的表示估计误差的 m m 协方差矩阵,即协方差矩阵,即 (2.1)32 Kalman滤波的初值可以按滤波的初值可以按 a0 和和 P0 或或 a1 0 和和 P1 0 指定。这样,每当得到一个观测值时,指定。这样,每当得到一个观测值时,Kalman滤波提供滤波提供了状态向量的最优估计。
20、当所有的了状态向量的最优估计。当所有的 T 个观测值都已处理,个观测值都已处理,Kalman滤波基于信息集合滤波基于信息集合 YT,产生当前状态向量和下,产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量和未来观测值的最优预测所需的所有信息。未来状态向量和未来观测值的最优预测所需的所有信息。33 平滑(平滑(smoothing)(t=T-1,T-2,1)(2.10)(2.11)其中:其中:aT|T,PT|T 是平滑的初值,由是平滑的初值,由Kalman滤波最后的迭代滤波最后的迭代得到。得到。还可以计算得到还可以计算得
21、到 yt 的平滑估计和协方差矩阵的平滑估计和协方差矩阵34 一步向前预测误差向量一步向前预测误差向量 (2.14)预测误差协方差矩阵由式预测误差协方差矩阵由式(2.6)的的 Ft 给定,即给定,即 (2.15)由后面由后面2.2节的论述可以知道条件均值节的论述可以知道条件均值 是是 yt 的最的最小均方误差意义的最优估计量小均方误差意义的最优估计量(MMSE)。因此,可以利用式。因此,可以利用式(2.13),以及,以及Kalman滤波公式滤波公式(2.2)(2.6),对,对 yt,t(t=T+1,T+2,)进行预测。)进行预测。35Kalman滤波的导出依赖于扰动项和初始状态向量滤波的导出依赖
22、于扰动项和初始状态向量服从正态分布的假设。有了正态分布的假设,就能够基服从正态分布的假设。有了正态分布的假设,就能够基于信息集合于信息集合 YT=yT,yT-1,y1 ,利用,利用Kalman滤波递滤波递推地计算推地计算 t 的分布。这些条件分布自身也都服从正态分的分布。这些条件分布自身也都服从正态分布,因此也就由它们的均值和协方差矩阵完全确定,这布,因此也就由它们的均值和协方差矩阵完全确定,这就是就是Kalman滤波计算的估计量。为了说明滤波计算的估计量。为了说明 t 的条件均值的条件均值 是是 t 在最小均方误差意义下的一个最优估计量,下面首在最小均方误差意义下的一个最优估计量,下面首先介
23、绍均方误差和最小均方估计的概念。先介绍均方误差和最小均方估计的概念。36 设设 z 是随机向量,已知样本集合是随机向量,已知样本集合 ZT=zT,zT-1,z1 ,是基于是基于ZT的的z的任一估计量,则定义均方误差(的任一估计量,则定义均方误差(mean square error,MSE)为)为 (2.16)设设 是基于是基于 ZT 的的 z 的任一估计量,的任一估计量,是其中使均方误是其中使均方误差达到最小的差达到最小的 z 的估计量,即的估计量,即 (2.17)则称则称 为为z的最小均方估计的最小均方估计(mininum mean square estimator,MMSE)。37 Kal
24、man滤波以信息集滤波以信息集 Yt 为条件,产生为条件,产生 t 的条件的条件均值和方差均值和方差 (2.18)(2.19)其中:数学期望算子下面的下标其中:数学期望算子下面的下标 t 表示是关于表示是关于 Yt 的条件的条件期望。期望。38 设设 是以信息集是以信息集 Yt 为条件的为条件的 t 的任一估计量,估计误的任一估计量,估计误差可以被分为两个部分差可以被分为两个部分 (2.20)对式对式(2.20)两端平方,并求期望值,经过计算,由于混两端平方,并求期望值,经过计算,由于混合乘积项为零,得到合乘积项为零,得到 (2.21)在式在式(2.21)等号右边的第一项是等号右边的第一项是
25、t 的条件方差,由于的条件方差,由于var(t Yt)0,且与估计量,且与估计量 无关,因此要想使式无关,因此要想使式(2.21)达到达到最小,只需在第二项取最小,只需在第二项取 即可。也就是说,即可。也就是说,t 的最小均方估计的最小均方估计(MMSE)就是由就是由Kalman滤波所得到的条件均滤波所得到的条件均值值 at=E(t Yt),并且是惟一的。,并且是惟一的。39 当状态空间模型的扰动项的分布不能满足正态分布假当状态空间模型的扰动项的分布不能满足正态分布假定时,一般地,定时,一般地,Kalman滤波所产生的估计量滤波所产生的估计量 at 不再是状态不再是状态向量向量 t 的条件均值
展开阅读全文