| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> SLAM 中的 Kalman Filter 推导 -> 正文阅读 |
|
[人工智能]SLAM 中的 Kalman Filter 推导 |
前言本篇博客主要还是进行不同卡尔曼滤波的数学推导,不会具体涉及到某些传感器。在理解了卡尔曼滤波的数学模型后,对于不同传感器只需要将其测量模型套入运动/观测模型即可。关于基于不同传感器的滤波融合方案,准备之后在阅读论文时再分别整理。 1. SLAM 中的定位概率模型在 SLAM 问题中,我们想要通过滤波方法求解的问题是:求解一个后验概率,即给定一系列观测(和输入)和初始时刻的先验位姿,估计每一个时刻的位姿,如下所示。 p ( x k ∣ x 0 , u 1 : k , z 0 : k ) p(\boldsymbol{x}_k | \boldsymbol{x}_0, \boldsymbol{u}_{1:k}, \boldsymbol{z}_{0:k}) p(xk?∣x0?,u1:k?,z0:k?) 其中, x 0 \boldsymbol{x}_0 x0? 为先验位姿, u 1 : k \boldsymbol{u}_{1:k} u1:k? 为 1 : k 1:k 1:k 时刻的输入, z 0 : k \boldsymbol{z}_{0:k} z0:k? 为 0 : k 0:k 0:k 时刻对环境的观测。我们可以将这些变量通过一个图来表示: 可以看出,在这种图模式下,每个状态仅仅依赖于前一时刻的位姿和输入,和历史位姿无关,这体现了一阶马尔科夫性。同理,观测也只和对应时刻的位姿(以及环境)有关。利用贝叶斯公式对后验概率进行展开有: p ( x k ∣ x 0 , u 1 : k , z 0 : k ) = p ( z k ∣ x k , x 0 , u 1 : k , z 0 : k ? 1 ) p ( x k ∣ x 0 , u 1 : k , z 0 : k ? 1 ) p ( z k ∣ x 0 , u 1 : k , z 0 : k ? 1 ) \begin{aligned} p(\boldsymbol{x}_k|\boldsymbol{x}_0, \boldsymbol{u}_{1:k}, \boldsymbol{z}_{0:k}) &= \frac{p(\boldsymbol{z}_k | \boldsymbol{x}_k, \boldsymbol{x}_0, \boldsymbol{u}_{1:k}, \boldsymbol{z}_{0:k-1})p(\boldsymbol{x}_k | \boldsymbol{x}_0, \boldsymbol{u}_{1:k}, \boldsymbol{z}_{0:k-1})}{p(\boldsymbol{z}_k|\boldsymbol{x}_0, \boldsymbol{u}_{1:k}, \boldsymbol{z}_{0:k-1})} \end{aligned} p(xk?∣x0?,u1:k?,z0:k?)?=p(zk?∣x0?,u1:k?,z0:k?1?)p(zk?∣xk?,x0?,u1:k?,z0:k?1?)p(xk?∣x0?,u1:k?,z0:k?1?)?? 上式即为最基本的贝叶斯滤波公式求解当前状态的后验概率,公式可以分为三部分:
因此,用比较通俗的话来描述一下贝叶斯滤波的过程:
这个流程中涉及两个部分:怎么从上一时刻的状态量结合输入预测当前时刻状态量;怎么在当前状态下获得对环境的观测分布。这分别对应系统中的两个模型: 运动模型: x k = f ( x k ? 1 , u k , w k ) \boldsymbol{x}_k = f(\boldsymbol{x}_{k-1}, \boldsymbol{u}_k, \boldsymbol{w}_k) xk?=f(xk?1?,uk?,wk?) 观测模型: z k = f ( x k , m , v k ) \boldsymbol{z}_k = f(\boldsymbol{x}_k, m, \boldsymbol{v}_k) zk?=f(xk?,m,vk?) 其中, w k , v k \boldsymbol{w}_k, \boldsymbol{v}_k wk?,vk? 分别是运动模型和观测模型的噪声, m m m 为环境信息。如果问题中不需要对环境信息估计的话,可以不考虑,在大部分视觉 SLAM 中会对环境中的特征点进行优化,此时,特征点会作为环境信息纳入优化中。 2. 卡尔曼滤波 Kalman Filter原始卡尔曼滤波推导卡尔曼滤波假设位姿和观测符合高斯分布,且运动模型和观测模型都是线性的,因此运动模型和观测模型可以写成以下形式: x k = F k x k ? 1 + G k u k + w k , w ~ N ( 0 , W ) z k = H k x k + v k , v ~ N ( 0 , V ) \begin{aligned} \boldsymbol{x}_k &= \boldsymbol{F}_k\boldsymbol{x}_{k-1} + \boldsymbol{G}_k\boldsymbol{u}_k + \boldsymbol{w}_k, \qquad &\boldsymbol{w} \sim \mathcal{N}(0, \boldsymbol{W})\\ \boldsymbol{z}_k &= \boldsymbol{H}_k\boldsymbol{x}_k + \boldsymbol{v}_k, \qquad &\boldsymbol{v} \sim \mathcal{N}(0, \boldsymbol{V}) \end{aligned} xk?zk??=Fk?xk?1?+Gk?uk?+wk?,=Hk?xk?+vk?,?w~N(0,W)v~N(0,V)? 为了把状态和先验和后验估计区分开,用 x ˇ \check{\boldsymbol{x}} xˇ 表示先验估计,用 x ^ \hat{\boldsymbol{x}} x^ 表示后验估计。其中运动模型中,上一时刻的状态后验写为: p ( x k ? 1 ∣ x 0 , u 1 : k ? 1 , z 0 : k ? 1 ) = N ( x ^ k ? 1 , P ^ k ? 1 ) p(\boldsymbol{x}_{k-1}|\boldsymbol{x}_0, \boldsymbol{u}_{1:k-1}, \boldsymbol{z}_{0:k-1}) = \mathcal{N}(\hat{\boldsymbol{x}}_{k-1}, \hat{\boldsymbol{P}}_{k-1}) p(xk?1?∣x0?,u1:k?1?,z0:k?1?)=N(x^k?1?,P^k?1?) 基于运动模型得到当前时刻的状态位姿的预测值同样服从高斯分布: x ˇ k ~ N ( μ ˇ k , P ˇ k ) \check{\boldsymbol{x}}_k \sim \mathcal{N}(\check{\boldsymbol{\mu}}_k, \check{\boldsymbol{P}}_k) xˇk?~N(μˇ?k?,Pˇk?) 预测值(先验分布)的均值和协方差矩阵根据运动模型和高斯分布下方差传播的性质得到: μ ˇ k = x ˇ k = f ( x ^ k ? 1 , u k , 0 ) = F k x k ? 1 + G k u k P ˇ k = F k ? 1 P ^ k ? 1 F k ? 1 T + W k \begin{aligned} \check{\boldsymbol{\mu}}_k &= \check{\boldsymbol{x}}_k = \boldsymbol{f}(\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{u}_k, \boldsymbol{0}) = \boldsymbol{F}_k\boldsymbol{x}_{k-1} + \boldsymbol{G}_k\boldsymbol{u}_k\\ \check{\boldsymbol{P}}_k &= \boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k-1}\boldsymbol{F}_{k-1}^T + \boldsymbol{W}_k \end{aligned} μˇ?k?Pˇk??=xˇk?=f(x^k?1?,uk?,0)=Fk?xk?1?+Gk?uk?=Fk?1?P^k?1?Fk?1T?+Wk?? 显然这一步我们得到的当前时刻的状态值估计的不确定度由于引入了运动误差,相比于上一时刻的不确定度变大了。观测模型的作用就是根据观测估计当前状态的后验概率,降低不确定度。 卡尔曼滤波可以分为以下几个阶段: 首先计算当前时刻状态量预测值的均值和方差: μ ˇ k = x ˇ k = F k x k ? 1 + G k u k P ˇ k = F k ? 1 P ^ k ? 1 F k ? 1 T + W k \begin{aligned} \check{\boldsymbol{\mu}}_k &= \check{\boldsymbol{x}}_k = \boldsymbol{F}_k\boldsymbol{x}_{k-1} + \boldsymbol{G}_k\boldsymbol{u}_k\\ \check{\boldsymbol{P}}_k &= \boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k-1}\boldsymbol{F}_{k-1}^T + \boldsymbol{W}_k \end{aligned} μˇ?k?Pˇk??=xˇk?=Fk?xk?1?+Gk?uk?=Fk?1?P^k?1?Fk?1T?+Wk?? 然后,计算以下式子,定义为卡尔曼增益: K k = ( P ˇ k H T ) ( H P ˇ k H T + V ) ? 1 \boldsymbol{K}_k = (\check{\boldsymbol{P}}_k\boldsymbol{H}^T)(\boldsymbol{H}\check{\boldsymbol{P}}_k\boldsymbol{H}^T + \boldsymbol{V})^{-1} Kk?=(Pˇk?HT)(HPˇk?HT+V)?1 最后,对预测值使用卡尔曼增益和观测值进行更新: μ ^ k = x ^ k = x ˇ k + K k ( z k ? H x ˇ k ) P ^ k = ( I ? K k H ) P ˇ k \begin{aligned} \hat{\boldsymbol{\mu}}_k = \hat{\boldsymbol{x}}_k &= \check{\boldsymbol{x}}_k + \boldsymbol{K}_k(\boldsymbol{z}_k - \boldsymbol{H}\check{\boldsymbol{x}}_k)\\ \hat{\boldsymbol{P}}_k &= (\boldsymbol{I} - \boldsymbol{K}_k\boldsymbol{H})\check{\boldsymbol{P}}_k \end{aligned} μ^?k?=x^k?P^k??=xˇk?+Kk?(zk??Hxˇk?)=(I?Kk?H)Pˇk??
原始卡尔曼滤波要求运动模型和观测模型都是线性的,这在实际情况下通常不满足,因此下面几个卡尔曼滤波的变种就是将卡尔曼滤波应用在非线性系统下的几种思路。 3. 扩展卡尔曼滤波 Extended Kalman Filter (EKF)扩展卡尔曼滤波的思路比较简单。既然卡尔曼滤波只能用在线性系统下,那么只要对非线性系统进行线性化就可以了。因此,对运动模型和观测模型使用泰勒展开进行线性化: x k = f ( x k ? 1 , u k , w k ) ≈ f ( x ^ k ? 1 , u k , 0 ) + ? f ? x ∣ x ^ k ? 1 , v k , 0 ( x k ? 1 ? x ^ k ? 1 ) + ? f ? w ∣ x ^ k ? 1 , v k , 0 ( w k ? 0 ) z k = h ( x k , v k ) ≈ h ( x ˇ k , 0 ) + ? h ? x ∣ x ˇ k , 0 ( x k ? x ˇ k ) + ? h ? v ∣ x ˇ k , 0 ( v k ? 0 ) \begin{aligned} \boldsymbol{x}_k &= f(\boldsymbol{x}_{k-1}, \boldsymbol{u}_k, \boldsymbol{w}_k)\\ &\approx f(\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{u}_k, \boldsymbol{0}) + \left.\frac{\partial f}{\partial \boldsymbol{x}}\right|_{\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{v}_{k}, \boldsymbol{0}}(\boldsymbol{x}_{k-1} - \hat{\boldsymbol{x}}_{k-1}) + \left.\frac{\partial f}{\partial \boldsymbol{w}}\right|_{\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{v}_{k}, \boldsymbol{0}}(\boldsymbol{w}_k - \boldsymbol{0})\\ \boldsymbol{z}_k &= h(\boldsymbol{x}_{k}, \boldsymbol{v}_k)\\ &\approx h(\check{\boldsymbol{x}}_{k}, \boldsymbol{0}) + \left.\frac{\partial h}{\partial\boldsymbol{x}}\right|_{\check{\boldsymbol{x}}_{k}, \boldsymbol{0}}(\boldsymbol{x}_{k} - \check{\boldsymbol{x}}_{k}) + \left.\frac{\partial h}{\partial\boldsymbol{v}}\right|_{\check{\boldsymbol{x}}_k, \boldsymbol{0}}(\boldsymbol{v}_k - \boldsymbol{0}) \end{aligned} xk?zk??=f(xk?1?,uk?,wk?)≈f(x^k?1?,uk?,0)+?x?f?∣∣∣∣?x^k?1?,vk?,0?(xk?1??x^k?1?)+?w?f?∣∣∣∣?x^k?1?,vk?,0?(wk??0)=h(xk?,vk?)≈h(xˇk?,0)+?x?h?∣∣∣∣?xˇk?,0?(xk??xˇk?)+?v?h?∣∣∣∣?xˇk?,0?(vk??0)? 将上式中四个雅可比分别用四个矩阵表示: F k = ? f ? x ∣ x ^ k ? 1 , v k , 0 Q k = ? f ? w ∣ x ^ k ? 1 , v k , 0 H k = ? h ? x ∣ x ˇ k , 0 R k = ? h ? v ∣ x ˇ k , 0 \begin{aligned} \boldsymbol{F}_k &= \left.\frac{\partial f}{\partial \boldsymbol{x}}\right|_{\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{v}_{k}, \boldsymbol{0}}\\ \boldsymbol{Q}_k &= \left.\frac{\partial f}{\partial \boldsymbol{w}}\right|_{\hat{\boldsymbol{x}}_{k-1}, \boldsymbol{v}_{k}, \boldsymbol{0}}\\ \boldsymbol{H}_k &= \left.\frac{\partial h}{\partial\boldsymbol{x}}\right|_{\check{\boldsymbol{x}}_{k}, \boldsymbol{0}}\\ \boldsymbol{R}_k &= \left.\frac{\partial h}{\partial\boldsymbol{v}}\right|_{\check{\boldsymbol{x}}_k, \boldsymbol{0}} \end{aligned} Fk?Qk?Hk?Rk??=?x?f?∣∣∣∣?x^k?1?,vk?,0?=?w?f?∣∣∣∣?x^k?1?,vk?,0?=?x?h?∣∣∣∣?xˇk?,0?=?v?h?∣∣∣∣?xˇk?,0?? 因此,线性化式子可以写成: x k ≈ x ˇ k + F k ? 1 ( x k ? 1 ? x ^ k ? 1 ) + Q k w k z k ≈ z ˇ k + H k ( x k ? x ˇ k ) + R k v k \begin{aligned} \boldsymbol{x}_k &\approx \check{\boldsymbol{x}}_{k} + \boldsymbol{F}_{k-1}(\boldsymbol{x}_{k-1} - \hat{\boldsymbol{x}}_{k-1}) + \boldsymbol{Q}_k\boldsymbol{w}_k\\ \boldsymbol{z}_k &\approx \check{\boldsymbol{z}}_k + \boldsymbol{H}_k(\boldsymbol{x}_{k} - \check{\boldsymbol{x}}_{k}) + \boldsymbol{R}_k\boldsymbol{v}_k \end{aligned} xk?zk??≈xˇk?+Fk?1?(xk?1??x^k?1?)+Qk?wk?≈zˇk?+Hk?(xk??xˇk?)+Rk?vk?? 接下来为了求卡尔曼增益,我们需要求线性化后的运动模型和观测模型的均值和协方差: 运动模型: E [ x k ] = μ ˇ k = E [ x ˇ k + F k ? 1 ( x k ? 1 ? x ^ k ? 1 ) + Q k w k ] = x ˇ k + F k ? 1 ( x k ? 1 ? x ^ k ? 1 ) + x ^ k ? 1 ) E [ ( x k ? E [ x k ] ) ( x k ? E [ x k ] ) T ] = P ˇ k ≈ E [ Q k w k w k T Q k T ] = Q k W Q T \begin{aligned} E[\boldsymbol{x}_k] &= \check{\boldsymbol{\mu}}_k = E[\check{\boldsymbol{x}}_{k} + \boldsymbol{F}_{k-1}(\boldsymbol{x}_{k-1} - \hat{\boldsymbol{x}}_{k-1}) + \boldsymbol{Q}_k\boldsymbol{w}_k]\\ &= \check{\boldsymbol{x}}_{k} + \boldsymbol{F}_{k-1}(\boldsymbol{x}_{k-1} - \hat{\boldsymbol{x}}_{k-1}) + \hat{\boldsymbol{x}}_{k-1})\\ E[(\boldsymbol{x}_k - E[\boldsymbol{x}_k])(\boldsymbol{x}_k - E[\boldsymbol{x}_k])^T] &= \check{\boldsymbol{P}}_k \approx E[\boldsymbol{Q}_k\boldsymbol{w}_k\boldsymbol{w}_k^T\boldsymbol{Q}_{k}^T]\\ &= \boldsymbol{Q}_k\boldsymbol{W}\boldsymbol{Q}^T \end{aligned} E[xk?]E[(xk??E[xk?])(xk??E[xk?])T]?=μˇ?k?=E[xˇk?+Fk?1?(xk?1??x^k?1?)+Qk?wk?]=xˇk?+Fk?1?(xk?1??x^k?1?)+x^k?1?)=Pˇk?≈E[Qk?wk?wkT?QkT?]=Qk?WQT? 同理可得观测模型: E ( z k ) ≈ z ˇ k + H k ( x k ? x ˇ k ) E ( ( z k ? E ( z k ) ) ( z k ? E ( z k ) ) T ) ≈ E [ R v k v k T R T ] = R V R T \begin{aligned} E(\boldsymbol{z}_k) &\approx \check{\boldsymbol{z}}_k + \boldsymbol{H}_k(\boldsymbol{x}_k - \check{\boldsymbol{x}}_k)\\ E((\boldsymbol{z}_k - E(\boldsymbol{z}_k))(\boldsymbol{z}_k - E(\boldsymbol{z}_k))^T) &\approx E[\boldsymbol{R}\boldsymbol{v}_k\boldsymbol{v}_k^T\boldsymbol{R}^T] = \boldsymbol{R}\boldsymbol{V}\boldsymbol{R}^T \end{aligned} E(zk?)E((zk??E(zk?))(zk??E(zk?))T)?≈zˇk?+Hk?(xk??xˇk?)≈E[Rvk?vkT?RT]=RVRT?
4. 迭代扩展卡尔曼滤波 Iterative Extended Kalman Filter (IEKF)IEKF 是在 EKF 上考虑了线性化误差的问题,EKF 的线性化点选择了在当前时刻的先验估计 x ˇ k \check{\boldsymbol{x}}_k xˇk? 进行。过程中线性化误差的会随着线性化点和工作点和差距而别大。因此一个很直观的想法是当我们通过这个线性化点得到当前时刻的后验估计 x ^ k \hat{\boldsymbol{x}}_k x^k? ,我们能不能以这个作为线性化点重新对观测模型进行线性化并重新估计当前时刻状态的后验分布。这个就是 IEKF 的思想。 大致上的流程就是先进行一次 EKF,得到第一次后验估计重复进行以下步骤: x o p , k = x ^ k z k ≈ z o p , k + H o p , k ( x k ? x o p , k ) + R k v k K k = ( P ˇ k H o p , k T ) ( H o p , k P ˇ k H o p , k T + R V R T ) ? 1 μ ^ k = x ^ k = x ˇ k + K k ( z k ? H o p , k ( x ˇ k ? x o p , k ) ) P ^ k = ( I ? K k H o p , k ) P ˇ k \begin{aligned} \boldsymbol{x}_{op, k} &= \hat{\boldsymbol{x}}_k\\ \boldsymbol{z}_k &\approx \boldsymbol{z}_{op, k} + \boldsymbol{H}_{op, k}(\boldsymbol{x}_{k} - \boldsymbol{x}_{op, k}) + \boldsymbol{R}_k\boldsymbol{v}_k\\ \boldsymbol{K}_k &= (\check{\boldsymbol{P}}_k\boldsymbol{H}_{op, k}^T)(\boldsymbol{H}_{op, k}\check{\boldsymbol{P}}_k\boldsymbol{H}_{op, k}^T + \boldsymbol{R}\boldsymbol{V}\boldsymbol{R}^T)^{-1}\\ \hat{\boldsymbol{\mu}}_k = \hat{\boldsymbol{x}}_k &= \check{\boldsymbol{x}}_k + \boldsymbol{K}_k(\boldsymbol{z}_k - \boldsymbol{H}_{op, k}(\check{\boldsymbol{x}}_k-\boldsymbol{x}_{op,k}))\\ \hat{\boldsymbol{P}}_k &= (\boldsymbol{I} - \boldsymbol{K}_k\boldsymbol{H}_{op, k})\check{\boldsymbol{P}}_k \end{aligned} xop,k?zk?Kk?μ^?k?=x^k?P^k??=x^k?≈zop,k?+Hop,k?(xk??xop,k?)+Rk?vk?=(Pˇk?Hop,kT?)(Hop,k?Pˇk?Hop,kT?+RVRT)?1=xˇk?+Kk?(zk??Hop,k?(xˇk??xop,k?))=(I?Kk?Hop,k?)Pˇk??
5. 基于误差状态的卡尔曼滤波 Error State Extended Kalman Filter (ES-EKF)…详情请参照古月居 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 2:23:09- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |