OpenCV - OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 《AICV实验室》

图像入门
视频入门
OpenCV 绘图功能
鼠标作为画笔
- 简单 Demo
- 高级 Demo
轨迹栏作为调色板

图像入门

学习目标：

图像的读取、显示、保存
学习三个函数：cv2.imread(), cv2.imshow() , cv2.imwrite()
使用 Matplotlib 来显示图像

# 导入常用包
#%matplotlib notebook
import numpy as np
import cv2
import matplotlib.pyplot as plt

读取显示图像

img = cv2.imread("img.jpg", 0) # 1: 显示原始图， 0：灰度图  -1：加载图像包括 alpha 通道
cv2.imshow("image", img) # 第一个参数为显示窗口的名称，第二个参数是要显示的图像
k = cv2.waitKey(0) & 0xFF # cv2.waitKey()  键盘绑定函数，等待键盘按下，以毫秒为计数单位，也可以设定特定按键点击。64 bit 的机器要 cv2.waitKey(0) & 0xFF
if k == 27:         # 等待按下 ESC 键退出， 
    cv2.destroyAllWindows() # 销毁所有窗口，也可以用 cv2.destroyWindow() 销毁特定的窗口。
elif k == ord('s'): # 指定某个按键按下后指定某种操作，如这里是保存
    cv2.imwrite('image_write.png',img)
    cv2.destroyAllWindows()

结果： OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图1

cv2.namedWindow("image_new", cv2.WINDOW_NORMAL) # 创建一个新的窗口，这个窗口大小可以进行调节的
cv2.imshow("image_new", img)
cv2.waitKey(0)
cv2.destroyWindow("image_new")

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图2

写图像（保存图像）

cv2.imwrite("image_write.png", img) # 保存图像，可以指定保存图像的格式

True

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图3

使用 matplotlib 显示图像

Matplotlib是一个用于Python的绘图库，它提供了多种绘图方法。在这里，将学习如何使用 Matplotlib 显示图像。可以使用 Matplotlib 放大图片，保存图片等。

img = cv2.imread("img.jpg", 0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic') # interpolation 插值
plt.xticks([])
plt.yticks([])  # 隐藏 X、Y 坐标的刻度值
plt.show()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图4

OpenCV 加载的彩色图像为 BGR 模式。但是 Matplotlib 以 RGB 模式显示。因此，如果使用 OpenCV 读取图像，Matplotlib 中的彩色图像将不能正确显示。

以下是解决办法：对图像的模式进行转换，使之与 Matplotlib 或 OpenCV 匹配

img_cv = cv2.imread("img.jpg") # OpenCV 读取图像
b, g, r = cv2.split(img_cv) # OpenCV 中图像显示是 BGR 模式，提取
img_matplot = cv2.merge([r, g, b])
plt.subplot(121)
plt.imshow(img_cv) # 预计图像会是异常的
plt.subplot(122)
plt.imshow(img_matplot) # 预计是真实的图像
plt.show()
cv2.imshow('bgr image',img_cv) # 预计图像会是异常的
cv2.imshow('rgb image',img_matplot) # 预计是真实的图像
cv2.waitKey(0)
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图5

视频入门

学习目标：

显示视频、保存视频
从相机进行捕获
cv2.VideoCapture(), cv2.VideoWriter() 函数使用

从相机捕获视频

笔记本自带摄像头

import cv2
# 创建一个 VideoCapture 对象，参数是设备的索引即摄像机的编号或者 Video 的文件名
# 这里的 0 是指第一台摄像机，以此类推
cap = cv2.VideoCapture(0)
while (True):
    # while cap.isOpened():
    # 一帧一帧的捕获
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    # 显示
    cv2.imshow("frame", gray)  # 窗口名为 frame
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()  # 关闭视频文件或设备
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图6
cap.read() 返回一个bool (True/False)。如果帧被正确读取，它将为真。通过检查这个返回值来检查视频的结尾。

有时，cap 可能没有初始化捕获。在这种情况下，这段代码显示错误。可以通过方法 cap.isOpened() 检查它是否初始化。如果为真，则 ok。否则使用 cap.open() 打开它。

可以通过 cap.get(propId) 获取视频的一些属性，propId 值为：0 to 18。每个值代表视频的一个属性，详见 Property Identifier 也可以通过 cap.set(propId, value) 设置视频的属性。
例如：可以通过 cap.get(3) 和 cap.get(4) 检查帧的宽和高，默认是 640x480。通过 ret = cap.set(3,320) 和 ret = cap.set(4,240) 将宽和高重新设定。

# 创建一个 VideoCapture 对象，参数是设备的索引即摄像机的编号或者 Video 的文件名
# 这里的 0 是指第一台摄像机，以此类推
cap = cv2.VideoCapture(0)
while (True):
    # while cap.isOpened():
    # 一帧一帧的捕获
    ret, frame = cap.read()
    ret = cap.set(3, 320)
    ret = cap.set(4, 240)
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    cv2.imshow("frame", gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图7

从文件进行播放

cap = cv2.VideoCapture('vtest.avi')
while(cap.isOpened()):
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    cv2.imshow('frame', gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图8

如果视频播放结束，还没按键按下，会出现错误。 改进如下：

import cv2
cap = cv2.VideoCapture('vtest.avi')
while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        cv2.imshow('frame', gray)
    if ret == False:
        # cap.release() # 释放掉开启的视频
        # print("1") # 测试
        cv2.waitKey(0)  # 暂停在最后一帧
        break  # 关闭窗口后退出
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

改进以后，程序会一直监测视频是否到最后一帧，若是最后一帧，则 ret 为 False ，暂停在最后一帧并且在关闭窗口后退出

保存视频

cap = cv2.VideoCapture(0)
# Define the codec and create VideoWriter object
# cv2.VideoWriter_fourcc('X','V','I','D') 功能一样
fourcc = cv2.VideoWriter_fourcc(*'XVID')
# 创建 VideoWriter 对象，指定输出文件名 output.avi， FourCC 代码，传递每秒帧数和帧大小
out = cv2.VideoWriter('output.avi', fourcc, 20.0, (640, 480))
while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:
        # 对每一帧进行翻转
        frame = cv2.flip(frame, 0)  # 注释见下
        # write the flipped frame
        out.write(frame)
        cv2.imshow('frame', frame)
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break
# Release everything if job is finished
cap.release()
out.release()
cv2.destroyAllWindows()

FourCC 是一个 4 字节的代码，用于指定视频编解码器，依赖于平台，到时看具体平台进行选择。更多 FourCC 代码见官网

cv2.flip(src, flipCode[, dst]) → dst: flipCode: 0表示绕 x 轴翻转，正值(例如，1)表示绕 y 轴翻转。负值(例如 -1)表示在两个轴上翻转。

OpenCV 绘图功能

学习目标:

使用 OpenCV 绘制不同几何形状
cv2.line(), cv2.circle() , cv2.rectangle(), cv2.ellipse(), cv2.putText()

以下图像都用 matplotlib 绘制

函数共有参数说明

img: 要操作的图像
color：绘制形状的颜色， RGB 传入元组如(255, 255, 255)，灰度值只需传入标量
thickness：线或圆等的厚度。如果对圆形等闭合图形传递 -1 ，则填充形状。默认为 1
lineType：线的类型

绘制各种形状

# 需要给定直线的起始和结束坐标
# 创建一个黑色的画布
img = np.zeros((512, 512, 3), np.uint8)
# 绘制坐标 (0, 0) -> (510, 128) 直线 蓝色，厚度为 5px
img = cv2.line(img, (0, 0), (511, 511), (255, 0, 0), 5)  # OpenCV 为 BGR 模式
# 绘制长方形，起始和终点坐标，颜色，厚度
img = cv2.rectangle(img, (384, 10), (505, 120), (0, 255, 0), 3)
# 绘制圆形，给定圆心，半径，最后 -1 为图形填充
img = cv2.circle(img, (447, 63), 63, (0, 0, 255), -1)
# 绘制椭圆，椭圆心，长轴，短轴，角度，起始结束角，填充
img = cv2.ellipse(img, (256, 256), (100, 50), 0, 0, 180, 255, -1)
# 绘制多边形，给定多边形的顶点坐标
pts = np.array([[50, 50], [40, 40], [60, 40], [60, 100]], np.int32)
pts = pts.reshape((-1, 1, 2))
# 若第三个参数为 False，则得到连接所有点的折线，而不是一个闭合的形状。该函数可以用来绘制多条直线
img = cv2.polylines(img, [pts], True, (0, 255, 255))
# 添加文字到图形中
font = cv2.FONT_HERSHEY_SIMPLEX  # 指定字体
cv2.putText(img, 'OpenCV', (10, 500), font, 4, (255, 255, 255),
            2, cv2.LINE_AA)  # 绘制的图像，文字，文字左下角的坐标,字体，字体颜色，厚度等
cv2.imshow("diff type", img)
k = cv2.waitKey(0) & 0xFF
if k == 27:
    cv2.destroyAllWindows()
b, g, r = cv2.split(img)
img = cv2.merge([r, g, b])
plt.subplot(121)
plt.xticks([])
plt.yticks([])
plt.imshow(img)

<matplotlib.image.AxesImage at 0x1d119e3b668>

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图9

作业：绘制 OpenCV 图标 OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图10

鼠标作为画笔

学习目标：

处理鼠标事件
cv2.setMouseCallback()

简单 Demo

首先，创建一个鼠标回调函数，该函数在鼠标事件发生时执行。鼠标事件可以是任何与鼠标相关的东西，如左键向下、左键向上、左键双击等。它为每个鼠标事件提供坐标 (x,y)。有了这个事件和位置，我们可以做任何我们想做的事情。

# 列出鼠标处理的事件
events = [i for i in dir(cv2) if 'EVENT' in i]
events

['EVENT_FLAG_ALTKEY',
 'EVENT_FLAG_CTRLKEY',
 'EVENT_FLAG_LBUTTON',
 'EVENT_FLAG_MBUTTON',
 'EVENT_FLAG_RBUTTON',
 'EVENT_FLAG_SHIFTKEY',
 'EVENT_LBUTTONDBLCLK',
 'EVENT_LBUTTONDOWN',
 'EVENT_LBUTTONUP',
 'EVENT_MBUTTONDBLCLK',
 'EVENT_MBUTTONDOWN',
 'EVENT_MBUTTONUP',
 'EVENT_MOUSEHWHEEL',
 'EVENT_MOUSEMOVE',
 'EVENT_MOUSEWHEEL',
 'EVENT_RBUTTONDBLCLK',
 'EVENT_RBUTTONDOWN',
 'EVENT_RBUTTONUP']

import cv2
import numpy as np
# 功能函数，在鼠标处左键双击，绘制白色填充的圆
def draw_circle(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDBLCLK:
        cv2.circle(img, (x, y), 100, (255, 255, 255), -1)
# 创建一个黑色画布
img = np.zeros((512, 512, 3), np.uint8)
cv2.namedWindow("image")
# 创建鼠标回调函数，绑定功能函数
cv2.setMouseCallback("image", draw_circle)
while(1):
    cv2.imshow("image", img)
    if cv2.waitKey(20) & 0xFF == 27:
        break
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图11

高级 Demo

现在我们要做更多更好的应用。在这里，通过拖动鼠标来绘制矩形或圆形(这取决于我们选择的模式)，就像在 Paint 应用程序中所做的那样。我们的鼠标回调函数有两部分，一部分用来画矩形，另一部分用来画圆。这个具体的例子将非常有助于创建和理解一些交互式应用程序，如对象跟踪，图像分割等。

import cv2
import numpy as np
drawing = False # 鼠标按下为 True
mode = True # 按键 'm' 切换模式
ix, iy = -1, -1
def draw(event, x, y, flags, param):
    global ix, iy, drawing, mode
    if event == cv2.EVENT_LBUTTONDOWN: # 鼠标放下
        drawing = True
        ix, iy = x, y # 鼠标放下时的坐标
    elif event == cv2.EVENT_MOUSEMOVE: # 鼠标移动
        if drawing == True:
            if mode == True:
                cv2.rectangle(img, (ix, iy), (x, y), (0, 255, 0), -1)
            else:
                cv2.circle(img, (x, y), 5, (0, 0, 255), -1)
    elif event == cv2.EVENT_LBUTTONUP: # 鼠标提起，结束绘制
        drawing = False
        # ------------- 中间这一段要不要？
        if mode == True:
            cv2.rectangle(img, (ix, iy), (x, y), (0, 255, 0), -1)
        else:
            cv2.circle(img, (x, y), 5, (0, 0, 255), -1)    
        # -------------
img = np.zeros((512, 512, 3), np.uint8)
cv2.namedWindow("image")
cv2.setMouseCallback("image", draw) # 功能绑定
while(1):
    cv2.imshow("image", img)
    k = cv2.waitKey(1) & 0xFF
    if k == ord('m'): # 按键 'm' 切换模式
        mode = not mode
    elif k == 27:
        break
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图12

轨迹栏作为调色板

学习目标：

将轨迹栏绑定到 OpenCV 窗口
cv2.getTrackbarPos(), cv2.createTrackbar()

Demo

创建简单的应用程序，通过滑动轨迹条调节 BGR 的值从而改变画布颜色，初始颜色为黑色。

cv2.createTrackbar() 函数，第一个参数是 trackbar 名称，第二个参数是将用作创建的 trackbar 的父窗口的名称，第三个参数是默认值，第四个参数是最大值，第五个参数是回调函数，每次 trackbar 值发生变化时都会执行回调函数。回调函数总是有一个默认参数，即 trackbar 位置。在我们的例子中，函数什么也不做，所以我们只是传递。

trackbar 的另一个重要应用是将其用作按钮或开关。默认情况下，OpenCV 没有按钮功能。所以你可以使用 trackbar 来获得这样的功能。在我们的应用程序中，我们已经创建了一个开关，在这个开关中应用程序只在开关打开时才工作，否则屏幕总是黑色的。

import cv2
import numpy as np
def nothing(x):
    pass
img = np.zeros((300, 512, 3), np.uint8)
cv2.namedWindow("image")
cv2.createTrackbar('R', 'image', 0, 255, nothing)
cv2.createTrackbar('G', 'image', 0, 255, nothing)
cv2.createTrackbar('B', 'image', 0, 255, nothing)
switch = '0 : OFF \n1 : ON'
cv2.createTrackbar(switch, 'image', 0, 1, nothing)
while(1):
    cv2.imshow('image', img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
    r = cv2.getTrackbarPos('R', 'image')
    g = cv2.getTrackbarPos('G', 'image')
    b = cv2.getTrackbarPos('B', 'image')
    s = cv2.getTrackbarPos(switch, 'image')
    if s == 0:
        img[:] = 0
    else:
        img[:] = [b, g, r]
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图13

练习

创建一个画笔颜色和笔刷半径可调的滑动轨迹条

import cv2
import numpy as np
def nothing(x):
    pass
radius_t = 1
bt, gt, rt = 255, 255, 255
def draw_circle(event, x, y, radius, b=255, g=255, r=255):
    global radius_t, bt, gt, rt
    radius = radius_t
    b, g, r = bt, gt, rt
    if event == cv2.EVENT_LBUTTONDBLCLK:
        cv2.circle(img, (x, y), radius, (b, g, r), -1)
img = np.zeros((1366, 768, 3), np.uint8)
cv2.namedWindow("image")
# --------- 画笔颜色
cv2.createTrackbar('brush_radius', 'image', 1, 10, nothing)
cv2.createTrackbar('pen_B', 'image', 0, 255, nothing)
cv2.createTrackbar('pen_G', 'image', 0, 255, nothing)
cv2.createTrackbar('pen_R', 'image', 0, 255, nothing)
# 创建鼠标回调函数，绑定功能函数
cv2.setMouseCallback("image", draw_circle)
while(1):
    cv2.imshow('image', img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
    brush_radius = cv2.getTrackbarPos('brush_radius', 'image')
    pen_B = cv2.getTrackbarPos('pen_B', 'image')
    pen_G = cv2.getTrackbarPos('pen_G', 'image')
    pen_R = cv2.getTrackbarPos('pen_R', 'image')
    # 对鼠标函数参数进行赋值
    radius_t = brush_radius 
    bt, gt, rt = pen_B, pen_G, pen_R
cv2.destroyAllWindows()

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性 - 图14

AICV实验室

OpenCV Python 系列教程2 - OpenCV 的 GUI 特性

图像入门

读取显示图像

写图像（保存图像）

使用 matplotlib 显示图像

更多资料

视频入门

从相机捕获视频

从文件进行播放

保存视频

更多资料

OpenCV 绘图功能

函数共有参数说明

绘制各种形状

更多资料

鼠标作为画笔

简单 Demo

高级 Demo

轨迹栏作为调色板

Demo

练习

更多资料