如何在 Python 中使用卡尔曼滤波器获取位置数据?

How to use Kalman filter in Python for location data?

[编辑] @Claudio 的回答给了我一个关于如何过滤异常值的非常好的提示。不过,我确实想开始对我的数据使用卡尔曼滤波器。所以我更改了下面的示例数据,使其具有不那么极端的细微变化噪声(我也经常看到)。如果其他人可以指导我如何在我的数据上使用 PyKalman,那就太好了。 [/编辑]

对于一个机器人项目,我正在尝试用相机跟踪空中的风筝。我在 Python 中编程,我在下面粘贴了一些嘈杂的位置结果(每个项目也包含一个日期时间对象,但为了清楚起见,我将它们省略了)。

[           # X     Y 
    {'loc': (399, 293)},
    {'loc': (403, 299)},
    {'loc': (409, 308)},
    {'loc': (416, 315)},
    {'loc': (418, 318)},
    {'loc': (420, 323)},
    {'loc': (429, 326)},  # <== Noise in X
    {'loc': (423, 328)},
    {'loc': (429, 334)},
    {'loc': (431, 337)},
    {'loc': (433, 342)},
    {'loc': (434, 352)},  # <== Noise in Y
    {'loc': (434, 349)},
    {'loc': (433, 350)},
    {'loc': (431, 350)},
    {'loc': (430, 349)},
    {'loc': (428, 347)},
    {'loc': (427, 345)},
    {'loc': (425, 341)},
    {'loc': (429, 338)},  # <== Noise in X
    {'loc': (431, 328)},  # <== Noise in X
    {'loc': (410, 313)},
    {'loc': (406, 306)},
    {'loc': (402, 299)},
    {'loc': (397, 291)},
    {'loc': (391, 294)},  # <== Noise in Y
    {'loc': (376, 270)},
    {'loc': (372, 272)},
    {'loc': (351, 248)},
    {'loc': (336, 244)},
    {'loc': (327, 236)},
    {'loc': (307, 220)}
]

我首先想到的是手动计算异常值,然后简单地将它们从数据中实时移除。然后我阅读了有关卡尔曼滤波器的内容,以及它们是如何专门用于消除噪声数据的。 因此,经过一番搜索,我发现 PyKalman library 似乎很适合这个。由于我有点迷失在整个卡尔曼滤波器术语中,所以我通读了 wiki 和其他一些关于卡尔曼滤波器的页面。我对卡尔曼滤波器有了大致的了解,但我真的不知道应该如何将它应用到我的代码中。

PyKalman docs中我找到了下面的例子:

>>> from pykalman import KalmanFilter
>>> import numpy as np
>>> kf = KalmanFilter(transition_matrices = [[1, 1], [0, 1]], observation_matrices = [[0.1, 0.5], [-0.3, 0.0]])
>>> measurements = np.asarray([[1,0], [0,0], [0,1]])  # 3 observations
>>> kf = kf.em(measurements, n_iter=5)
>>> (filtered_state_means, filtered_state_covariances) = kf.filter(measurements)
>>> (smoothed_state_means, smoothed_state_covariances) = kf.smooth(measurements)

我只是用以下观察结果代替了我自己的观察结果:

from pykalman import KalmanFilter
import numpy as np
kf = KalmanFilter(transition_matrices = [[1, 1], [0, 1]], observation_matrices = [[0.1, 0.5], [-0.3, 0.0]])
measurements = np.asarray([(399,293),(403,299),(409,308),(416,315),(418,318),(420,323),(429,326),(423,328),(429,334),(431,337),(433,342),(434,352),(434,349),(433,350),(431,350),(430,349),(428,347),(427,345),(425,341),(429,338),(431,328),(410,313),(406,306),(402,299),(397,291),(391,294),(376,270),(372,272),(351,248),(336,244),(327,236),(307,220)])
kf = kf.em(measurements, n_iter=5)
(filtered_state_means, filtered_state_covariances) = kf.filter(measurements)
(smoothed_state_means, smoothed_state_covariances) = kf.smooth(measurements)

但这并没有给我任何有意义的数据。例如,smoothed_state_means 变为以下内容:

>>> smoothed_state_means
array([[-235.47463353,   36.95271449],
       [-354.8712597 ,   27.70011485],
       [-402.19985301,   21.75847069],
       [-423.24073418,   17.54604304],
       [-433.96622233,   14.36072376],
       [-443.05275258,   11.94368163],
       [-446.89521434,    9.97960296],
       [-456.19359012,    8.54765215],
       [-465.79317394,    7.6133633 ],
       [-474.84869079,    7.10419182],
       [-487.66174033,    7.1211321 ],
       [-504.6528746 ,    7.81715451],
       [-506.76051587,    8.68135952],
       [-510.13247696,    9.7280697 ],
       [-512.39637431,   10.9610031 ],
       [-511.94189431,   12.32378146],
       [-509.32990832,   13.77980587],
       [-504.39389762,   15.29418648],
       [-495.15439769,   16.762472  ],
       [-480.31085928,   18.02633612],
       [-456.80082586,   18.80355017],
       [-437.35977492,   19.24869224],
       [-420.7706184 ,   19.52147918],
       [-405.59500937,   19.70357845],
       [-392.62770281,   19.8936389 ],
       [-388.8656724 ,   20.44525168],
       [-361.95411607,   20.57651509],
       [-352.32671579,   20.84174084],
       [-327.46028214,   20.77224385],
       [-319.75994982,   20.9443245 ],
       [-306.69948771,   21.24618955],
       [-287.03222693,   21.43135098]])

比我聪明的人能给我一些正确方向的提示或例子吗?欢迎所有提示!

据我所知,使用卡尔曼滤波可能不适合您的情况。

这样做怎么样? :

lstInputData = [
    [346, 226 ],
    [346, 211 ],
    [347, 196 ],
    [347, 180 ],
    [350, 2165],  ## noise
    [355, 154 ],
    [359, 138 ],
    [368, 120 ],
    [374, -830],  ## noise
    [346, 90  ],
    [349, 75  ],
    [1420, 67 ],  ## noise
    [357, 64  ],
    [358, 62  ]
]

import pandas as pd
import numpy as np
df = pd.DataFrame(lstInputData)
print( df )
from scipy import stats
print ( df[(np.abs(stats.zscore(df)) < 1).all(axis=1)] )

此处输出:

      0     1
0    346   226
1    346   211
2    347   196
3    347   180
4    350  2165
5    355   154
6    359   138
7    368   120
8    374  -830
9    346    90
10   349    75
11  1420    67
12   357    64
13   358    62
      0    1
0   346  226
1   346  211
2   347  196
3   347  180
5   355  154
6   359  138
7   368  120
9   346   90
10  349   75
12  357   64
13  358   62

请参阅 here 了解更多信息以及我从中获取上述代码的来源。

TL;DR,请看底部的代码和图片。

我认为卡尔曼滤波器在您的应用程序中可以很好地工作,但它需要更多地考虑风筝的 dynamics/physics。

我强烈推荐阅读 this webpage。我与作者没有关系,也不了解作者,但我花了大约一天的时间试图了解卡尔曼滤波器,这个页面真的让我点击了它。

简单地说;对于一个线性且具有已知动态的系统(即,如果您知道状态和输入,您可以预测未来状态),它提供了一种最佳方法,可以结合您对系统的了解来估计它的真实状态。巧妙的一点(由您在描述它的页面上看到的所有矩阵代数处理)是它如何最佳地组合您拥有的两条信息:

  1. 测量(受制于 "measurement noise",即传感器不完美)

  2. 动力学(即你认为状态如何根据输入而演变,而输入又受 "process noise" 的影响,这只是说你的模型与现实不完全匹配的一种方式)。

您指定您对其中每一项的确定程度(分别通过 co-variances 矩阵 RQ), 卡尔曼增益 决定了你应该相信你的模型(即你当前对你的状态的估计)的程度,以及你应该相信你的测量结果的程度。

事不宜迟,让我们构建一个简单的风筝模型。我在下面提出的是一个非常简单的可能模型。您或许对 Kite 的动力学了解更多,因此可以创造出更好的风筝。

让我们把风筝看成一个粒子(显然是一种简化,真正的风筝是一个扩展body,所以在 3 个维度上有一个方向),它有四种状态,为了方便我们可以写成状态向量:

x = [x, x_dot, y, y_dot],

其中 x 和 y 是位置,_dot 是每个方向上的速度。根据您的问题,我假设有两个(可能有噪声的)测量值,我们可以将其写在测量向量中:

z = [x, y],

我们可以write-down测量矩阵(H讨论hereobservation_matricespykalman库中:

z = Hx => H = [[1, 0, 0 , 0], [0, 0, 1, 0]]

然后我们需要描述系统动力学。在这里我假设没有外力作用,风筝的运动没有阻尼(有了更多的知识你可能会做得更好,这有效地将外力和阻尼视为 unknown/unmodeled 扰动) .

在这种情况下,当前样本 "k" 中我们每个状态的动态作为先前样本 "k-1" 中状态的函数给出如下:

x(k) = x(k-1) + dt*x_dot(k-1)

x_dot(k) = x_dot(k-1)

y(k) = y(k-1) + dt*y_dot(k-1)

y_dot(k) = y_dot(k-1)

其中 "dt" 是 time-step。我们假设 (x, y) 位置根据当前位置和速度更新,并且速度保持不变。鉴于没有给出单位,我们只能说速度单位是这样的,我们可以从上面的等式中省略 "dt",即以 position_units/sample_interval 为单位(我假设您的测量样本处于恒定间隔) .我们可以将这四个方程总结为一个动力学矩阵,如(此处讨论的 F,以及 pykalman 库中的 transition_matrices

x(k) = Fx(k-1) => F = [[1, 1, 0, 0], [0, 1, 0, 0], [0, 0, 1, 1], [0, 0, 0, 1]].

我们现在可以尝试在 python 中使用卡尔曼滤波器。根据您的代码修改:

from pykalman import KalmanFilter
import numpy as np
import matplotlib.pyplot as plt
import time

measurements = np.asarray([(399,293),(403,299),(409,308),(416,315),(418,318),(420,323),(429,326),(423,328),(429,334),(431,337),(433,342),(434,352),(434,349),(433,350),(431,350),(430,349),(428,347),(427,345),(425,341),(429,338),(431,328),(410,313),(406,306),(402,299),(397,291),(391,294),(376,270),(372,272),(351,248),(336,244),(327,236),(307,220)])

initial_state_mean = [measurements[0, 0],
                      0,
                      measurements[0, 1],
                      0]

transition_matrix = [[1, 1, 0, 0],
                     [0, 1, 0, 0],
                     [0, 0, 1, 1],
                     [0, 0, 0, 1]]

observation_matrix = [[1, 0, 0, 0],
                      [0, 0, 1, 0]]

kf1 = KalmanFilter(transition_matrices = transition_matrix,
                  observation_matrices = observation_matrix,
                  initial_state_mean = initial_state_mean)

kf1 = kf1.em(measurements, n_iter=5)
(smoothed_state_means, smoothed_state_covariances) = kf1.smooth(measurements)

plt.figure(1)
times = range(measurements.shape[0])
plt.plot(times, measurements[:, 0], 'bo',
         times, measurements[:, 1], 'ro',
         times, smoothed_state_means[:, 0], 'b--',
         times, smoothed_state_means[:, 2], 'r--',)
plt.show()

产生以下结果表明它在抑制噪音方面做得很好(蓝色是 x 位置,红色是 y 位置,x-axis 只是样本编号)。

假设你看了上面的情节,觉得它看起来太颠簸了。你怎么能解决这个问题?如上所述,卡尔曼滤波器作用于两条信息:

  1. 测量值(在本例中是我们的两个状态,x 和 y)
  2. 系统动力学(和当前状态估计)

上面模型中捕获的动态非常简单。从字面上看,他们说位置将根据当前速度更新(以一种明显的、物理上合理的方式),并且速度保持不变(这显然不是物理上真实的,但抓住了我们的直觉,即速度应该缓慢变化)。

如果我们认为估计的状态应该更平滑,实现这一点的一种方法是说我们对测量的信心低于我们的动力学(即我们有更高的observation_covariance,相对于我们的state_covariance).

从上面代码的末尾开始,将 observation covariance 固定为之前估计值的 10 倍,设置em_vars 如图所示,需要避免观察协方差的 re-estimation(参见 here

kf2 = KalmanFilter(transition_matrices = transition_matrix,
                  observation_matrices = observation_matrix,
                  initial_state_mean = initial_state_mean,
                  observation_covariance = 10*kf1.observation_covariance,
                  em_vars=['transition_covariance', 'initial_state_covariance'])

kf2 = kf2.em(measurements, n_iter=5)
(smoothed_state_means, smoothed_state_covariances)  = kf2.smooth(measurements)

plt.figure(2)
times = range(measurements.shape[0])
plt.plot(times, measurements[:, 0], 'bo',
         times, measurements[:, 1], 'ro',
         times, smoothed_state_means[:, 0], 'b--',
         times, smoothed_state_means[:, 2], 'r--',)
plt.show()

这会产生下面的图(测量值作为点,状态估计值作为虚线)。差异相当细微,但希望您能看到它更平滑。

最后,如果你想使用这个拟合过滤器 on-line,你可以使用 filter_update 方法。注意这里使用的是filter方法而不是smooth方法,因为smooth方法只能应用于批量测量。更多 here:

time_before = time.time()
n_real_time = 3

kf3 = KalmanFilter(transition_matrices = transition_matrix,
                  observation_matrices = observation_matrix,
                  initial_state_mean = initial_state_mean,
                  observation_covariance = 10*kf1.observation_covariance,
                  em_vars=['transition_covariance', 'initial_state_covariance'])

kf3 = kf3.em(measurements[:-n_real_time, :], n_iter=5)
(filtered_state_means, filtered_state_covariances) = kf3.filter(measurements[:-n_real_time,:])

print("Time to build and train kf3: %s seconds" % (time.time() - time_before))

x_now = filtered_state_means[-1, :]
P_now = filtered_state_covariances[-1, :]
x_new = np.zeros((n_real_time, filtered_state_means.shape[1]))
i = 0

for measurement in measurements[-n_real_time:, :]:
    time_before = time.time()
    (x_now, P_now) = kf3.filter_update(filtered_state_mean = x_now,
                                       filtered_state_covariance = P_now,
                                       observation = measurement)
    print("Time to update kf3: %s seconds" % (time.time() - time_before))
    x_new[i, :] = x_now
    i = i + 1

plt.figure(3)
old_times = range(measurements.shape[0] - n_real_time)
new_times = range(measurements.shape[0]-n_real_time, measurements.shape[0])
plt.plot(times, measurements[:, 0], 'bo',
         times, measurements[:, 1], 'ro',
         old_times, filtered_state_means[:, 0], 'b--',
         old_times, filtered_state_means[:, 2], 'r--',
         new_times, x_new[:, 0], 'b-',
         new_times, x_new[:, 2], 'r-')

plt.show()

下图显示了过滤方法的性能,包括使用 filter_update 方法找到的 3 个点。点是测量值,虚线是过滤器训练期间的状态估计,实线是 "on-line" 期间的状态估计。

以及时间信息(在我的笔记本电脑上)。

Time to build and train kf3: 0.0677888393402 seconds
Time to update kf3: 0.00038480758667 seconds
Time to update kf3: 0.000465154647827 seconds
Time to update kf3: 0.000463008880615 seconds