图像金字塔

作者|OpenCV-Python Tutorials
编译|Vincent
来源|OpenCV-Python Tutorials

目标

在本章中,

  • 我们将学习图像金字塔
  • 我们将使用图像金字塔创建一个新的水果“Orapple”
  • 我们将看到以下功能:cv.pyrUp(),cv.pyrDown()

理论

通常,我们过去使用的是恒定大小的图像。但是在某些情况下,我们需要使用不同分辨率的(相同)图像。例如,当在图像中搜索某些东西(例如人脸)时,我们不确定对象将以多大的尺寸显示在图像中。在这种情况下,我们将需要创建一组具有不同分辨率的相同图像,并在所有图像中搜索对象。这些具有不同分辨率的图像集称为“图像金字塔”(因为当它们堆叠在底部时,最高分辨率的图像位于顶部,最低分辨率的图像位于顶部时,看起来像金字塔)。

有两种图像金字塔。1)高斯金字塔和2)拉普拉斯金字塔

高斯金字塔中的较高级别(低分辨率)是通过删除较低级别(较高分辨率)图像中的连续行和列而形成的。然后,较高级别的每个像素由基础级别的5个像素的贡献与高斯权重形成。通过这样做,$M×N$图像变成$M/2 × N/2$图像。因此面积减少到原始面积的四分之一。它称为Octave。当我们在金字塔中越靠上时(即分辨率下降),这种模式就会继续。同样,在扩展时,每个级别的面积变为4倍。我们可以使用cv.pyrDown()和cv.pyrUp()函数找到高斯金字塔。

  1. img = cv.imread('messi5.jpg')
  2. lower_reso = cv.pyrDown(higher_reso)

以下是图像金字塔中的4个级别。

图像金字塔 - 图1

现在,您可以使用cv.pyrUp()函数查看图像金字塔。

  1. higher_reso2 = cv.pyrUp(lower_reso)

记住,higher_reso2不等于higher_reso,因为一旦降低了分辨率,就会丢失信息。下面的图像是3层的金字塔从最小的图像在前面的情况下创建。与原图对比:

图像金字塔 - 图2

拉普拉斯金字塔由高斯金字塔形成。没有专用功能。拉普拉斯金字塔图像仅像边缘图像。它的大多数元素为零。它们用于图像压缩。拉普拉斯金字塔的层由高斯金字塔的层与高斯金字塔的高层的扩展版本之间的差形成。拉普拉斯等级的三个等级如下所示(调整对比度以增强内容):

图像金字塔 - 图3

使用金字塔进行图像融合

金字塔的一种应用是图像融合。例如,在图像拼接中,您需要将两个图像堆叠在一起,但是由于图像之间的不连续性,可能看起来不太好。在这种情况下,使用金字塔混合图像可以无缝混合,而不会在图像中保留大量数据。一个经典的例子是将两种水果,橙和苹果混合在一起。现在查看结果本身,以了解我在说什么:

图像金字塔 - 图4

请检查其他资源中的第一个参考,它具有图像混合,拉普拉斯金字塔等的完整图解详细信息。只需完成以下步骤即可:

  1. 加载苹果和橙子的两个图像
  2. 查找苹果和橙子的高斯金字塔(在此示例中, 级别数为6)
  3. 在高斯金字塔中,找到其拉普拉斯金字塔
  4. 然后在每个拉普拉斯金字塔级别中加入苹果的左半部分和橙子的右半部分
  5. 最后从此联合图像金字塔中重建原始图像。

下面是完整的代码。(为简单起见,每个步骤都是单独进行的,这可能会占用更多的内存。如果需要,可以对其进行优化)。

  1. import cv2 as cv
  2. import numpy as np,sys
  3. A = cv.imread('apple.jpg')
  4. B = cv.imread('orange.jpg')
  5. # 生成A的高斯金字塔
  6. G = A.copy()
  7. gpA = [G]
  8. for i in xrange(6):
  9. G = cv.pyrDown(G)
  10. gpA.append(G)
  11. # 生成B的高斯金字塔
  12. G = B.copy()
  13. gpB = [G]
  14. for i in xrange(6):
  15. G = cv.pyrDown(G)
  16. gpB.append(G)
  17. # 生成A的拉普拉斯金字塔
  18. lpA = [gpA[5]]
  19. for i in xrange(5,0,-1):
  20. GE = cv.pyrUp(gpA[i])
  21. L = cv.subtract(gpA[i-1],GE)
  22. lpA.append(L)
  23. # 生成B的拉普拉斯金字塔
  24. lpB = [gpB[5]]
  25. for i in xrange(5,0,-1):
  26. GE = cv.pyrUp(gpB[i])
  27. L = cv.subtract(gpB[i-1],GE)
  28. lpB.append(L)
  29. # 现在在每个级别中添加左右两半图像
  30. LS = []
  31. for la,lb in zip(lpA,lpB):
  32. rows,cols,dpt = la.shape
  33. ls = np.hstack((la[:,0:cols/2], lb[:,cols/2:]))
  34. LS.append(ls)
  35. # 现在重建
  36. ls_ = LS[0]
  37. for i in xrange(1,6):
  38. ls_ = cv.pyrUp(ls_)
  39. ls_ = cv.add(ls_, LS[i])
  40. # 图像与直接连接的每一半
  41. real = np.hstack((A[:,:cols/2],B[:,cols/2:]))
  42. cv.imwrite('Pyramid_blending2.jpg',ls_)
  43. cv.imwrite('Direct_blending.jpg',real)
  44. ##

附加资源

  1. Image Blending:http://pages.cs.wisc.edu/~csverma/CS766_09/ImageMosaic/imagemosaic.html

练习