• ">


    1. 机器学习进阶-图像特征sift-SIFT特征点
    2. 1.cv2.xfeatures2d.SIFT_create(实例化sift)
    3. 2. sift.detect(找出关键点)
    4. 3.cv2.drawKeypoints(画出关键点)
    5. 4.sift.compute(根据关键点计算sift向量)
    6. 1. sift = cv2.xfeatures2d.SIFT_create() 实例化
    7. 参数说明:sift为实例化的sift函数
    8. 2. kp = sift.detect(gray, None) 找出图像中的关键点
    9. 参数说明: kp表示生成的关键点,gray表示输入的灰度图,
    10. 3. ret = cv2.drawKeypoints(gray, kp, img) 在图中画出关键点
    11. 参数说明:gray表示输入图片, kp表示关键点,img表示输出的图片
    12. 4.kp, dst = sift.compute(kp) 计算关键点对应的sift特征向量
    13. 参数说明:kp表示输入的关键点,dst表示输出的sift特征向量,通常是128维的

    第一步:进行高斯模糊,获得不同模糊度的图片
    第二步:进行直接的降采样,获得多分辨的图片
    第三步:将高斯模糊后的图片进行相减操作获得差分金字塔,使用DOC公式
    第四步:对差分金字塔进行上下金字塔的比较,获得极值点
    第五步:使用泰勒展开式,获得精确的极值点
    第六步:使用herrian公式,通过特征向量变化,比较λ1和λ2的大小,用于消除边界点
    第七步:使用sobel算子,计算特征点的梯度大小和梯度方向
    第八步:统计特征点临近位置的梯度方向,做出直方图,求出特征点的主要方向
    第九步:对应于特征的主要方向,进行旋转,保持特征点大小的方向不变性
    第十步:对领域的特征点进行统计,按照44的数目,每个区域生成8个方向,即每个方向的出现的次数作为特征,一般使用16个区域,即168= 128个特征
    shift特征点:用来进行侦查和描述图片的特征,它在空间尺度中寻找极值点,并提取位置,尺度(梯度大小),旋转不变量(方向)
    流程:
    第一步:先对图像进行高斯模糊,获得5-6张的模糊后的图片,高斯方程为G(x, y, σ) = 1/(2piσ^2) e^-(x^2+y^2)/2σ^2,σ越大,高斯模糊的程度就越高
    机器学习进阶-图像特征sift-SIFT特征点 - 图1 这里的G(x, y, σ)方程存在一些错误
    机器学习进阶-图像特征sift-SIFT特征点 - 图2这是高斯模糊后的图片
    第二步:构造多分辨金字塔,多分辨金字塔的构造直接使用降采样不需要模糊的操作,这里可以使用平均降采样
    机器学习进阶-图像特征sift-SIFT特征点 - 图3
    第三步:构造高斯差分金字塔, 图中的每组5张图片为原始图片经过不同σ高斯参数模糊后获得的图。将5张图进行上下的相减操作,获得右边的差分图
    机器学习进阶-图像特征sift-SIFT特征点 - 图4

    下面这个式子表示的是高斯差分金字塔,即不同的高斯项进行相减,最后*I(x, y)表示差分金字塔的大小值
    机器学习进阶-图像特征sift-SIFT特征点 - 图5

    第四步:对获得的高斯差分金字塔,查找极值点, 对于一个点是否是极值点,将其上面一幅图对应的9个点+下面一幅图对应的9个点,加上该点周围的8的点,判断这个点是否是极值点
    机器学习进阶-图像特征sift-SIFT特征点 - 图6
    第五步:如果是极值点,即为关键点,这里我们对关键点做一个精确的定位,这里使用泰勒公式进行展开
    D(x) = D + ∂ D^T / ∂x x + 1/2 x^T ∂D^2 / ∂^X^2 x x表示的是x轴上的偏移量,对x进行求导等于0,解得最终的结果代回D(x),D(x)为最终的极值点
    机器学习进阶-图像特征sift-SIFT特征点 - 图7该图使用简化的泰勒展开式,求解0这一点的近似值
    最下面的D(x, y, z) 为泰勒的二阶展开式
    机器学习进阶-图像特征sift-SIFT特征点 - 图8将上述进行简单表示,这就是偏移的D(x), 即获得实际的极值点
    第六步:消除边界效应
    使用harris角点检测的原理, 求出H(x, y) 即构造的梯度变化矩阵,求解λ1和λ2, 如果λ1>>λ2则表示为边界点,进行去除
    机器学习进阶-图像特征sift-SIFT特征点 - 图9
    第七步:使用sobel算子,每个特征点得到三个信息,获得位置, 计算梯度的大小,以及梯度的方向
    机器学习进阶-图像特征sift-SIFT特征点 - 图10
    第八步:统计相邻部分的梯度的方向,画出直方图,把直方图中出现次数最多的作为主方向,如果次方向的次数大于主方向的0.8,那么次方向也是辅助方向
    机器学习进阶-图像特征sift-SIFT特征点 - 图11
    第九步:将梯度的方向进行按照原来的方向进行旋转,以保证梯度旋转的不变性
    机器学习进阶-图像特征sift-SIFT特征点 - 图12
    第十步:对特征点进行领域的位置统计,来生成sift特征向量, 对于左边的那个图,从44个领域中统计八个方向,因此有48个sift,右边有16个即16*8=128个特征向量
    机器学习进阶-图像特征sift-SIFT特征点 - 图13 机器学习进阶-图像特征sift-SIFT特征点 - 图14
    代码:
    第一步:读入图片
    第二步:进行灰度化
    第三步:使用cv2.xfeatures2d.SIFT_create() 实例化sift函数
    第四步:使用sift.detect(gray, None) 生成关键点
    第五步:使用cv2.drawKeypoints 进行画图操作
    第六步:使用sift.compute(kp) 求得关键点对应的128个特征向量

    1. import numpy as np
    2. import cv2
    3. img = cv2.imread('test_1.jpg')
    4. gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    5. sift = cv2.xfeatures2d.SIFT_create()
    6. # 找出关键点
    7. kp = sift.detect(gray, None)
    8. # 对关键点进行绘图
    9. ret = cv2.drawKeypoints(gray, kp, img)
    10. cv2.imshow('ret', ret)
    11. cv2.waitKey(0)
    12. cv2.destroyAllWindows()
    13. # 使用关键点找出sift特征向量
    14. kp, des = sift.compute(gray, kp)
    15. print(np.shape(kp))
    16. print(np.shape(des))
    17. print(des[0])