常见的2D图像变换从原理上讲主要包括基于2×3矩阵的仿射变换和基于3×3矩阵透视变换。

仿射变换

原理

基本的图像变换就是二维坐标的变换:从一种二维坐标(x,y)到另一种二维坐标(u,v)的线性变换:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图1
如果写成矩阵的形式,就是:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图2
作如下定义:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图3
矩阵T(2×3)就称为仿射变换的变换矩阵,R为线性变换矩阵,t为平移矩阵,简单来说,仿射变换就是线性变换+平移。变换后直线依然是直线,平行线依然是平行线,直线间的相对位置关系不变,因此非共线的三个对应点便可确定唯一的一个仿射变换,线性变换4个自由度+平移2个自由度→仿射变换自由度为6。

opencv中实现仿射变换

  1. import cv2 as cv
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. img = cv.imread('drawing.jpg')
  5. rows, cols = img.shape[:2]
  6. # 变换前的三个点
  7. pts1 = np.float32([[50, 65], [150, 65], [210, 210]])
  8. # 变换后的三个点
  9. pts2 = np.float32([[50, 100], [150, 65], [100, 250]])
  10. # 生成变换矩阵
  11. M = cv.getAffineTransform(pts1, pts2)
  12. # 第三个参数为dst的大小
  13. dst = cv.warpAffine(img, M, (cols, rows))
  14. plt.subplot(121), plt.imshow(img), plt.title('input')
  15. plt.subplot(122), plt.imshow(dst), plt.title('output')
  16. plt.show()

实验结果

opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图4

应用opencv中现成的图像平移、旋转、缩放、翻转

请参考 opencv实现图像几何变换

平移

opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图5
平移就是x和y方向上的直接移动,可以上下/左右移动,自由度为2,变换矩阵可以表示为:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图6

旋转

opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图7
旋转是坐标轴方向饶原点旋转一定的角度θ,自由度为1,不包含平移,如顺时针旋转可以表示为:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图8

翻转

翻转是x或y某个方向或全部方向上取反,自由度为2,比如这里以垂直翻转为例:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图9

刚体变换

旋转+平移也称刚体变换(Rigid Transform),就是说如果图像变换前后两点间的距离仍然保持不变,那么这种变化就称为刚体变换。刚体变换包括了平移、旋转和翻转,自由度为3。由于只是旋转和平移,刚体变换保持了直线间的长度不变,所以也称欧式变换(变化前后保持欧氏距离)。变换矩阵可以表示为:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图10

缩放

opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图11缩放是x和y方向的尺度(倍数)变换,在有些资料上非等比例的缩放也称为拉伸/挤压,等比例缩放自由度为1,非等比例缩放自由度为2,矩阵可以表示为:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图12

相似变换

相似变换又称缩放旋转,相似变换包含了旋转、等比例缩放和平移等变换,自由度为4。在OpenCV中,旋转就是用相似变换实现的:
若缩放比例为scale,旋转角度为θ,旋转中心是(centerx,centery),则仿射变换可以表示为:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图13
其中:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图14
相似变换相比刚体变换加了缩放,所以并不会保持欧氏距离不变,但直线间的夹角依然不变。

透视变换

前面仿射变换后依然是平行四边形,并不能做到任意的变换。
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图15

原理

透视变换(Perspective Transformation)是将二维的图片投影到一个三维视平面上,然后再转换到二维坐标下,所以也称为投影映射(Projective Mapping)。简单来说就是二维→三维→二维的一个过程。
透视变换公式:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图16
透视变换矩阵表示:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图17
仿射变换是透视变换的子集。接下来再通过除以Z轴转换成二维坐标:
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图18
透视变换相比仿射变换更加灵活,变换后会产生一个新的四边形,但不一定是平行四边形,所以需要非共线的四个点才能唯一确定,原图中的直线变换后依然是直线。因为四边形包括了所有的平行四边形,所以透视变换包括了所有的仿射变换。

opencv中实现透视变换

OpenCV中首先根据变换前后的四个点用cv.getPerspectiveTransform()生成3×3的变换矩阵,然后再用cv.warpPerspective()进行透视变换。

  1. import numpy as np
  2. import cv2 as cv
  3. import matplotlib.pyplot as plt
  4. img = cv.imread('card.jpg')
  5. # 原图中卡片的四个角点
  6. pts1 = np.float32([[148, 80], [437, 114], [94, 247], [423, 288]])
  7. # 变换后分别在左上、右上、左下、右下四个点
  8. pts2 = np.float32([[0, 0], [320, 0], [0, 178], [320, 178]])
  9. # 生成透视变换矩阵
  10. M = cv.getPerspectiveTransform(pts1, pts2)
  11. # 进行透视变换,参数3是目标图像大小
  12. dst = cv.warpPerspective(img, M, (320, 178))
  13. plt.subplot(121), plt.imshow(img[:, :, ::-1]), plt.title('input')
  14. plt.subplot(122), plt.imshow(dst[:, :, ::-1]), plt.title('output')
  15. plt.show()

实验结果

opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图19

总结

图解图像各种变换
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图20
opencv 图像变换原理详解 图像平移 图像旋转 图像缩放 - 图21