第3章-粒子滤波方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第3章-粒子滤波方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 粒子 滤波 方法 课件
- 资源描述:
-
1、第3章 粒子滤波方法第3章 粒子滤波方法3.1 引言3.2 贝叶斯滤波3.3 贝叶斯重要性采样3.4 序贯重要性重采样粒子滤波算法3.5 马尔可夫链蒙特卡罗粒子滤波算法3.6 辅助粒子滤波算法3.7 正则化粒子滤波算法3.8 边缘粒子滤波算法3.9 扩展卡尔曼粒子滤波算法3.10 高斯和粒子滤波算法3.11 小结第3章 粒子滤波方法3.1 引引 言言粒子滤波是指通过寻找一组在状态空间中传播的随机样本,对概率密度函数p(xk|yk)进行近似,以样本均值代替积分运算,从而获得状态的最小方差估计的一种算法。粒子滤波算法依据系统状态向量的先验分布在状态空间中产生一组随机样本,然后根据观测量不断地调整粒
2、子的权值和位置,通过调整后的粒子信息修正最初的后验概率函数。用数学语言可描述为:针对平稳的时变系统,假定k1时刻系统的后验概率密度为p(xk1|yk1),依据一定规则选取N个随机样本点,在k时刻获得量测信息后, 经过状态更新和时间更新过程, N个粒子的后验概率密度近似为p(xk|yk), 随着粒子数的增加,粒子的概率密度函数就能逼近状态真实的概率密度函数,对状态向量的估计结果与最优贝叶斯估计结果接近。粒子滤波适用于非线性非高斯系统的状态估计,突破了传统卡尔曼滤波理论框架,精度可以逼近最优估计,是一种有效的非线性滤波技术,广泛应用于数字通信、图像视频处理、计算机视觉、语音信号处理、机器学习等领域
3、。第3章 粒子滤波方法3.2 贝贝 叶叶 斯斯 滤滤 波波对于跟踪问题,目标状态序列的状态转移可以用下面的目标状态序列xk,kN的演变方程来描述(3-1)11(,)kkkfxxv其中,是关于状态xk1的非线性函数,是独立同分布的过程噪声序列,nx,nv分别是状态和过程噪声向量的维数。系统量测方程为:xvxnnnf1,kkv(3-2)(,)kkkhzxn第3章 粒子滤波方法从贝叶斯估计观点来看,跟踪问题就是计算k时刻状态xk的某种置信程度。从1到k时刻,由于给定量测数据z1: k的值不同,得出的xk值也不同,因此需要构造概率密度函数p(xk|z1: k)。假定初始概率密度函数p(x0|z0)p(
4、x0),x0表示初始状态向量,z0表示尚且没有获得量测值,它也是先验概率密度函数。因此从形式上看,通过预测和更新两个步骤就可以递推地得到概率密度函数p(xk|z1: k)的值。假定k1时刻的概率密度函数已知,那么通过ChapmanKolmogorov等式及使用模型(3-1)就可以预测出k时刻状态的先验概率密度函数(3-3)1:1111:11(|)(|) (|)kkkkkkkpppdxzxxxzx第3章 粒子滤波方法在等式(3-3)中,p(xk|xk1)=p(xk|xk1,z1: k1),且满足等式(3-1)所描述的一阶马尔可夫过程。状态估计p(xk|xk1)的概率模型由系统等式(3-1)和统计
5、值vk1来确定。在k时刻,可以得到量测值z=,然后通过贝叶斯规则更新先验概率密度函数1:11:1:1(|) (|)(|)(|)kkkkkkkkppppzxxzxzzz(3-4)式中的常量(3-5)1:11:1(|)(|) (|)dkkkkkkkpppzzzxxzx是由模型(3-2)定义的似然函数p(zk|xk)和一步预测的统计值p(xk|z1: k1)共同确定的。在更新式子(3-4)中,量测值zk被用来修正先验概率,以获得当前状态的后验概率。第3章 粒子滤波方法式(3-3)和式(3-4)是最优贝叶斯估计的一般形式。通过以上步骤递推得到的后验概率只是一般概念下的表达式,通常情况下难以得到其解析表
6、达式。只有在满足特定条件时,才可以得到最优贝叶斯解。第3章 粒子滤波方法3.3 贝叶斯重要性采样贝叶斯重要性采样在贝叶斯重要性采样中,后验概率分布由一组离散的样本集近似得到。根据大数定理,随着样本粒子数N的增加,期望Eg(x0: k)可由近似求出。但是,通常很难从后验概率密度函数中直接抽样。常规的解决办法是从容易采样的概率分布q(x0:k|y1:k)中采样粒子,由此可以得到0:E ()kg x0:1:0:0:0:1:0:0:1:1:0:0:0:0:1:0:1:0:1:0:0:0:1:0:1:(|)E ()()(|)d(|)(|) ()()(|)d() (|)()()(|)d()kkkkkkkk
7、kkkkkkkkkkkkkkkkkpggqqppgqpqwgqpxyxxxyxxyyxxxxyxyxyxxxyxy(3-6)第3章 粒子滤波方法式中w(x0: k)是未归一化的重要性权值,可以表示为(3-7)1:0:0:0:1:(|) ()(|)kkkkkkppwqyxxxy由于p(y1: k)是未知的,我们可以将式(3-6)表示为0000101000100110000100010001011E ()() () ()d()() () ()d()() ()d()() () ()d() ()dE (:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k:k
8、:k:k:k:kq:ggwq|pgwq|q|p|pq|gwq|wq|xxxxyxyxxxyxxyyxxxxyxxxyxxxyxy0010)( ()()E ()( ()k:k:kq:k:kwg|wxxyx(3-8)第3章 粒子滤波方法式中Eq(|y1: k)是指在概率分布q(|y1: k)上进行计算的期望。通过从概率函数q(|y1: k)中采样,期望可以近似表示为(3-9)( )( )0:0:( )( )10:0:0:( )10:11g() ()E ()() ()1()NiikkNiiikkkNiikiwNggwwNxxxxxx式中的重要性权值表示为( ) ikw (3-10)( )( )( )
9、1iikkNjkjwww等式(3-9)计算出来的结果是有偏的。但是,通过以下两个假设可以使逐渐收敛,并且接近于真实值。(1) x(i)0: k是从后验概率分布中采样得到的一组粒子,Eg(x0: k)存在并且是有限的;0:E ()kg x第3章 粒子滤波方法(2) 在后验概率分布上计算出的wk和wkg2(x0: k)的期望存在而且有限。只有g(x0: k)的方差和重要性权值有限才能验证第二个假设的成立性。随着N值的无限增大,后验概率分布函数就会近似于点估计分布,即(3-11)( )0:( )0:1:0:1(|)()ikNikkkkipwdxxyx第3章 粒子滤波方法3.4 序贯重要性重采样粒子滤
10、波算法序贯重要性重采样粒子滤波算法3.4.1 序贯重要性采样序贯重要性采样贝叶斯重要性采样(Sequential Importance Sampling, SIS)2, 3是一种简单常用的蒙特卡罗积分方法,但是它不能直接用来做递推估计。这主要是因为估计p(x0: k|y1: k)需要用到所有的观测数据y1: k,每次更新观测数据yk+1时,需要重新计算整个状态序列的重要性权值,因此它的计算量随着时间的推移而不断增加。为了解决该问题,人们提出了序贯重要性采样方法。该方法在k时刻采样时不改动过去的状态序列x0: k1,而采用如下递推形式计算重要性权值(3-12)0:1:0:11:10:11:(|)
11、(|) (|,)kkkkkkkqqqxyxyxxy第3章 粒子滤波方法这里先假设当前状态不依赖于将来的观测,即只进行滤波而不考虑平滑。需要强调的是,在某些情况下,一些建议分布需要用到过去的状态序列。在本书中,不考虑这种情况。假设状态符合马尔可夫过程,在给定状态下,量测值是条件独立的,则可得(3-13)0:011()()(|)kkjjjpppxxxx1:0:1(|)(|)kkkjjjppyxyx(3-14)将式(3-12)、式(3-13)和式(3-14)代入式(3-7)中得到权值递推公式(3-15)1:0:0:0:11:10:11:1:0:0:11:10:10:10:11:110:11:(|)
12、()(|) (|,)(|) ()1(|) ()(|,)(|) (|)(|,)kkkkkkkkkkkkkkkkkkkkkkkkkkkppwqqppwppqppwqyxxxyxxyyxxyxxxxyyxxxxxy第3章 粒子滤波方法在给定合适的重要性分布函数q(xk|x0: k1,y1: k)的条件下,式(3-15)提供了一个递推计算重要性权值的方法,重要性权值的计算因此得以简化。第3章 粒子滤波方法3.4.2 序贯重要性采样问题及策略序贯重要性采样问题及策略1. 选取好的重要性密度函数选取好的重要性密度函数选择合适的重要性密度函数是重要性采样算法中的关键步骤。选择重要性密度函数的一个原则是使得权
13、系数的方差最小。Doucet等提出了在给定x0: k1和y1: k的条件下权系数方差最小的最优密度函数许多学者也都证明了上式成立。尽管如此,为方便起见,多数粒子滤波算法中的重要性函数还是选择了次优的q(xk|x0: k1, y1: k)=p(xk|x0: k1)。由于未能利用最新的量测信息,以该函数进行抽样所产生的方差比后验概率p(xk|x0: k1,y1: k)产生的方差大,但由于其容易实现,在粒子滤波算法中依然得到了广泛的应用。(3-16)0:11:0:11:(|,)(|,)kkkkkkqpxxyxxy第3章 粒子滤波方法2. 粒子退化问题粒子退化问题序贯重要性采样方法的一个严重缺陷是粒子
14、退化问题,即经过几次迭代后,可能只有少数几个粒子有非零权值,其它粒子的权值非常小,可以忽略不计。出现这种现象是由于随着时间的增加,重要性权值的方差也在增加。退化现象使得大量的计算工作都浪费在更新那些对p(xk|y1: k)的估计几乎不起作用的粒子上。1998年,Liu和Chen给出了一种衡量粒子数匮乏程度的方法3,15,该方法定义“有效粒子数”Neff为(3-17)eff1var()ikNNw式中。Neff越小,表明粒子退化现象越严重。一般很难确切计算出Neff的值,但可以用下式计算Neff的估计值Neff1:1(|) / (|,)iiiikkkkkkwpqxzxxz第3章 粒子滤波方法(3-
15、18)eff211()NikiNw式中wik是由式(3-15)定义的归一化的权值。由式(3-18)易知NeffN。通过有效粒子数可以衡量当前粒子群的退化程度,当粒子群退化现象比较严重时,采取增加粒子数的办法来减小粒子群的退化程度,但这种方法的计算量太大,制约了算法的实时性。因此,通常采取另一种方法,即在SIS之后对重要性样本进行重采样。第3章 粒子滤波方法3. 重采样重采样重采样是抑制粒子退化现象的一种手段。设定一个有效样本数Nth并将其作为阈值,当Neff0时,T(x,y)0。给定当前状态xk,MH(MetropolisHastings)算法的步骤如下:Step 1:根据建议函数T(xk,y
16、)转移。Step 2:从均匀分布中抽样得到UUniform0,1,然后更新状态(3-26)1,(, ),otherwisekkkyUr xyxx( ) ( , )( , )min 1,( ) ( , )p y T y xr x yp x T x y式中,。第3章 粒子滤波方法显然,当T(x,y)对称时,上述算法等价于Metropolis算法。Barker于1965年提出了另外一种接受函数,即( ) ( , )( , )( ) ( , )( ) ( , )Bp y T y xrx yp y T y xp x T x y(3-27)Charlesstein提出了更一般的接受函数,即(3-28)(
17、, )( , )( ) ( , )x yr x yp x T x y式中,(x,y)为任意的对称函数,只需要满足对于任何x和y都有r(x,y)1即可。当选用式(3-28)作为接受函数时,从x转移到y的转移概率可以表示为(3-29)1( , )( , ) ( , )( )( , )A x yT x y r x yp xx y第3章 粒子滤波方法由于(x,y)=(y,x),故有p(x)A(x,y)=p(y)A(y,x),即由上述过程产生的马尔可夫链是可逆的,且p(x)是马尔可夫链的平稳分布。第3章 粒子滤波方法3.5.4 马尔可夫链蒙特卡罗粒子滤波算法步骤马尔可夫链蒙特卡罗粒子滤波算法步骤MCMC
18、粒子滤波算法5通过构造马尔可夫链产生来自目标分布的样本(粒子),使样本更加多样化,具有很好的收敛性。在粒子滤波中引入MH(MetropolisHastings)采样的具体过程如下:Step 1:按照均匀分布从区间0,1中采样得到门限值u,即uUniform0,1。Step 2:按照概率p(xk|x(i)k1)采样得到。( )( )1(|)iikkkxp xxStep 3:若,则接受,即 ;否则丢弃,保留重采样的粒子,即 。MCMC方法的缺陷是, 为了保证收敛所需要的概率转移次数较大, 算法增加的计算量较大, 而且其收敛的判断也是个问题。( )( )(|)min 1,(|)ikkikkp zxu
19、p zx( ) ikx( )( )iikkxx( ) ikx( )ikx( )( )iikkxx第3章 粒子滤波方法3.6 辅助粒子滤波算法辅助粒子滤波算法辅助粒子滤波算法(Auiliary Particle Filter, APF)由Pitt和Shephard提出6,是序贯重要性重采样滤波器的变形。APF是从联合密度函数p(xk,i|z1: k)中得到一个抽样,其中i是辅助变量,表示在k1时刻可对xk预测的采样粒子即xik1xk。引入一个重要性密度函数q(xk,i|z1: k),进行采样xjk,ijNj=1,其中ij是k1时刻可对xk预测的采样粒子。运用贝叶斯准则可将联合密度函数表示为(3-
20、30)1:1:11:11:111(, |)(|, ,) (, |) ( |)(|) (|)kkkkkkkkiikkkkkpipipip ippwxzzxzxzzzxxx选择重要性密度函数,并使该函数满足以下比例(3-31)1:11(, |)(|) (|)iiikkkkkkkqippwxzzxx第3章 粒子滤波方法其中,ik是在xik1的条件下关于状态变量xk的某种统计信息。一般情况下,可以取均值,或者一个样本满足ikp(xk|xik1)。从重要性密度函数q(xk,i|z1: k)中抽样的粒子(xjk,ij)权值满足(3-32)111:(|) (|)(|)(,|)(|)jjjjjijiikkkk
21、kkkkjjikkkkpppwwqipzxxxzxxzz其中,由式(3-30)和式(3-31)可得出式(3-32)。这些带权值的粒子集 的分布近似于p(xk,i|z1: k),通过辅助变量ij的替换,即可从p(xk,i|z1: k)中得到想要的抽样粒子。将重要性函数因式分解为1,pNjjjkkjiwx(3-33)1:1:1:11(, |)( |) (| ,)( (|) (|)iiikkkkkkkkkkqiq iqipwpxzzxzzxx第3章 粒子滤波方法3.7 正则化粒子滤波算法正则化粒子滤波算法重采样作为一种减少粒子退化问题的方法在粒子滤波中得到广泛应用,但是也带来了新的问题,最主要的问题
22、就是粒子多样性的消失。这是因为在重采样时,样本是从离散分布而不是连续分布中抽样的。如果此问题得不到很好的处理,将可能导致“粒子崩溃”。“粒子崩溃”是一种很严峻的粒子匮乏现象,即所有的粒子都占据状态空间上的同一个点,从而不能很好地反映后验分布。正则化粒子滤波(Regularized Particle Filter, RPF)算法可以在一定程度上解决此问题16。RPF算法是从后验密度p(xk|z1: k)的连续近似中进行重采样的,即(3-34)1:1(|)()sNiikkkhkkipw Kxzxx第3章 粒子滤波方法其中,是重新调整过的核密度K(),h0是核的带宽(标量),nx是状态向量x的维数,
23、wik(i=1,2,N)是经过归一化后的权值。核密度是一个对称的概率密度函数,且有1( )( )hnKKhhxxx( )d0,Kxxx2( )dK xxx(3-35)选择合适的核函数K()和带宽h,使得真实的后验概率密度和相应的正则化经验表示的积分均方误差(Mean Integrated Square Error, MISE)的均值最小,该式定义为(3-36)21:1:MISE( )E(|)(|)dkkkkkpppxzxzx式中,p(|)表示在条件(3-34)下对p(xk|z1: k)的近似。在特殊情况下,所有的采样有相同的权值,核的最优选择是Epanechnikov核,即第3章 粒子滤波方法
24、 (3-37)2opt2(1x ),if120,xxnnxcK其它式中, 是 的单位球的体积。进一步说,当密度函数是服从单位协方差矩阵的高斯分布时,带宽的最优选择为ncxnx1/(4)optnhANx(3-38)其中1/(4)18(4)(2 ) nnnAcnxxxx(3-39)假设分布具有单位协方差矩阵的高斯密度,能够保证估计密度的协方差与样本的经验协方差矩阵S相等。第3章 粒子滤波方法3.8 边缘粒子滤波算法边缘粒子滤波算法3.8.1 问题描述问题描述对于非线性非高斯状态模型,粒子滤波提供了一种通用的计算方法来逼近后验密度函数。然而,虽然粒子滤波很容易实现,适合处理任意的非线性系统估计,但是
25、其主要缺点是计算复杂度随着状态变量维数的增加而迅速增大。为了降低粒子滤波的计算复杂度,文献10提出了边缘粒子滤波算法(Marginalized Particle Filter, MPF),主要是将状态向量的线性部分进行边缘化处理,在粒子滤波过程中加入卡尔曼滤波算法,即:用卡尔曼滤波处理线性部分,而用常规粒子滤波处理非线性部分。第3章 粒子滤波方法所讨论的非线性非高斯滤波问题,可以概括在一个通用离散时间状态空间模型中,在给定观测值的条件下,递推地计算状态向量的后验概率密度函数。模型方程可表述如下xk+1=f(xk,wk) (3-41) yk=h(xk,ek) (3-42)式中,yk是k时刻的量测
展开阅读全文