背景减法

目标

在本章中,

  • 我们将熟悉在 OpenCV 里几种可行的背景减除方法

基础

背景减法是许多基于计算机视觉应用的主要预处理操作。举个例子,想象一下一个固定在柜台的摄像机需要计算进来与出去房间的人的数量的情况抑或是提取有关车辆等信息的交通摄像头等等。在所有这些情况下,首先你需要做的便是单独提取出人亦或是交通工具。从技术上来讲,你需要从静态的背景中提取出移动的前景。

如果你只有背景图像,像是没有访客的房间图像,没有车辆的道路图像等等,进行背景减法将是一件容易的事。只需要从背景图像中减去新图像。你便能得到前景对象了。但是,在大多数情况下,你可能并没有这样的图片,所以你需要从我们拥有的图像中提取背景。当车辆有阴影时情况会变得更加复杂。由于阴影也会移动,因此简单的减法也会将其标记为前景。这使得背景减除变得复杂。

为此我们引入了几种算法。OpenCV 已经实现了三种很容易使用的算法。我们将逐一看到它们。

BackgroundSubtractorMOG

这是一个基于高斯混合背景/前景分割的算法。这个算法在 P. KadewTraKuPong 和 R. Bowden 于 2001 年的论文“一种改进的自适应背景混合模型,用于带阴影检测的实时跟踪”中被引出。这个算法使用 K 个高斯模型进行混合用以表征背景中各个像素点(K = 3 到 5)。每个高斯模型的权值代表着当前场景下各种颜色所占时间的比例。而可能是背景的颜色则停留时间更长且更具静态性。

当我们编写程序的时候,我们需要使用cv.createBackgroundSubtractorMOG()函数创建背景对象。这个函数有一些可选参数,像是用于构建背景模型的帧数,混合的高斯模型个数,阈值等等。将它们全部设定为默认值。然后在视频循环中,使用 backgroundsubtractor.apply()函数获取前景蒙版。

下面是一个简单的例子:

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture('vtest.avi')
  4. fgbg = cv.bgsegm.createBackgroundSubtractorMOG()
  5. while(1):
  6. ret, frame = cap.read()
  7. fgmask = fgbg.apply(frame)
  8. cv.imshow('frame',fgmask)
  9. k = cv.waitKey(30) & 0xff
  10. if k == 27:
  11. break
  12. cap.release()
  13. cv.destroyAllWindows()

(所有结果都在最后给出以供比较)

BackgroundSubtractorMOG2

这也是一个基于高斯混合背景/前景分割的算法。这个算法基于 Z.Zivkovic 于 2004 年发布的“改进的自适应高斯混合模型用于背景减法”和“2006 年发布的“用于背景减法任务的每个图像像素的有效自适应密度估计”两篇论文。该算法的一个重要的特征便是它为每一个像素点均选择适当数量的高斯分布。(记住,在最后一种情况,我们在整个算法中利用了 K 高斯模型)。它应对不同场景中光照变化等因素将提供更好的适应性。

在上一种情况中,我们创建了一个背景减法器的对象。在这里,你可以选择是否检测阴影。如果 detectShadows = True (默认是 True),它将检测并遮罩阴影部分,但这样会降低计算速度。阴影将会被标记为灰色。

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture('vtest.avi')
  4. fgbg = cv.createBackgroundSubtractorMOG2()
  5. while(1):
  6. ret, frame = cap.read()
  7. fgmask = fgbg.apply(frame)
  8. cv.imshow('frame',fgmask)
  9. k = cv.waitKey(30) & 0xff
  10. if k == 27:
  11. break
  12. cap.release()
  13. cv.destroyAllWindows()

(结果在最下方给出)

BackgroundSubtractorGMG

这个算法结合了静态背景图像估计和每个像素的贝叶斯分割。此算法于 2012 年由 Andrew B. Godbehere,Akihiro Matsukawa 和 Ken Goldberg 发布的“可变照明条件下的人类访问者视觉跟踪以响应音频艺术装置“论文中被提出并介绍。根据该论文,该系统于 2011 年 3 月 31 日至 7 月 31 日在加利福尼亚州旧金山的当代犹太博物馆举办了一场名为“我们在那里吗?”的成功互动音频艺术装置。

它使用起始的一些帧(默认为 120 个)进行背景建模。它采用概率前景分割算法,使用贝叶斯推断识别可能的前景对象。它采用概率前景分割算法也就是使用贝叶斯推理识别可能的前景对象。这种估计是自适应的。在适应变化的光照中,新的观察者比旧观察者拥有更高的权重。进行几个形态过滤上操作如闭和开操作用以移除不必要的噪点。在前几帧你将得到一个完全黑色的窗口。

如果能够利用开运算移除噪声结果会更好。

  1. import numpy as np
  2. import cv2 as cv
  3. cap = cv.VideoCapture('vtest.avi')
  4. kernel = cv.getStructuringElement(cv.MORPH_ELLIPSE,(3,3))
  5. fgbg = cv.bgsegm.createBackgroundSubtractorGMG()
  6. while(1):
  7. ret, frame = cap.read()
  8. fgmask = fgbg.apply(frame)
  9. fgmask = cv.morphologyEx(fgmask, cv.MORPH_OPEN, kernel)
  10. cv.imshow('frame',fgmask)
  11. k = cv.waitKey(30) & 0xff
  12. if k == 27:
  13. break
  14. cap.release()
  15. cv.destroyAllWindows()

结果

原始帧

下面这张图片展示了一个视频的第 200 帧

resframe

resframe image

使用 BackgroundSubtractorMOG 后

resmog

resmog image

使用 BackgroundSubtractorMOG2 后

灰色区域显示阴影区域

resmog2

resmog2 image

使用 BackgroundSubtractorGMG 后

通过数学形态学中的开运算移除噪声

resgmg

resgmg image

其他资源

练习