用 OpenCV 开发难免会针对 Camera 或者是 Video 做处理,有的时候需要将画面保留下来,这个时候最佳方案是保存成一个 .avi 的文件。
OpenCV 底层是用 FFMEPG 进行多媒体开发的,所以 OpenCV 它的长项不在于此,它只是提供了这种能力而已,如果要针对多媒体文件做复杂的处理,推荐的还是 FFMEPG 专业库。
OpenCV 用来创建视频文件的类是 VideoWriter。
但首先,给大家普及一些视频类相关的知识点。
文件后缀名
我们一般都知道视频文件是 .mp4、.3gp、.rmvb 等等格式的,但一个文件取这样的后缀名是为了告诉用户或者操作系统,它的内容是什么格式的。我们也可以将 rmvb 格式的文件取名为 *.avi。后缀的目的是为了方便用专业的工具或者软件操作它们。文件格式
我们可以将一个视频文件看做一个容器。
简单地说就是可以看做是一个盒子。
这个盒子里面有视频画面数据、音频数据、字幕数据等等。
- 编码格式
视频容器中,一般有视频和音频数据,它们采取的编码方式不一样。
视频常见的编码方式通常有: x264、h264、mpeg-4
音频常见的编码方式通常有: mp3、AAC、flac
编码的目的主要是为了高效存储和传输,如果你不采用编码压缩的话,那么视频可以看做是一系列的图片序列,体积会非常大。
- 编码器和解码器
把视频或者音频按照编码格式,编码成特定文件格式需要编码器的参与,不然每次开发重新写代码代价很高。
把特定文件格式解码成特定的编码格式数据,这个过程称为解码,需要解码器的存在。
解码器和编码器都有开源的或者收费的工具库,极大方便了开发者。
- FPS 帧率
我们读初中物理时,大概了解过电影画面一秒钟 24 帧,其实对应的就是 24 fps,frame per second,有些手机有高速摄像的功能,原理就是能够 1 秒钟拍摄 960 张图片,然后用正常的速度放映出来,所以细节比较多。
fps 越高,细节越好,体验也越好,但是文件容量也越高。
不同的文件格式如 mp4、avi、mkv 等等,它们存放 打包数据的方式不一样,文件内部文件编码方式也可能不一样。
6.VideoWriter
用 OpenCV 保存视频非常简单,通过调用它的 VideoWriter类。详细函数格式 VideoWriter(filename, fourcc, fps, frameSize[, isColor])。
第一个参数是要保存的文件的路径
fourcc 指定编码器
fps 要保存的视频的帧率
frameSize 要保存的文件的画面尺寸
isColor 指示是黑白画面还是彩色的画面
7.一些其他细节
通过摄像头捕捉读入视频,获取第一个摄像头cv2.VideoCapture(0),如果有多个摄像头可以修改参数,比如改成1是第二个摄像头。
视频编解码器VideoWriter_fourcc,fourcc意思为四字符代码(Four-Character-Codes),顾名思义该编码由4个字符组成,下面是VideoWriter_fourcc对象的一些常用参数,注意:字符顺序不能弄混。
cv2.VideoWriter_fourcc(‘I’, ‘4’, ‘2’, ‘0’),该参数是YUV编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘P’, ‘I’, ‘M’, ‘I’),该参数是MPEG-1编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’),该参数是MPEG-4编码类型,文件名后缀为.avi
cv2.VideoWriter_fourcc(‘T’, ‘H’, ‘E’, ‘O’),该参数是Ogg Vorbis,文件名后缀为.ogv
cv2.VideoWriter_fourcc(‘F’, ‘L’, ‘V’, ‘1’),该参数是Flash视频,文件名后缀为.flv
fourcc 本身是一个 32 位的无符号数值,用 4 个字母表示采用的编码器。 常用的有 “DIVX”、”MJPG”、“XVID”、“X264”。
推荐使用 ”XVID”, cv2.VideoWriter_fourcc(*’XVID’),但一般依据你的电脑环境安装了哪些编码器。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2020/3/29 10:11
# @Author : King110108
# @File : webcame.py
# @Description:
# @IDE : PyCharm
import cv2
cap = cv2.VideoCapture(0) #读取摄像头,0为摄像头索引,当有多个摄像头时,从0开始编号
fourcc = cv2.VideoWriter_fourcc(*'XVID') #创建视频流写入对象,VideoWriter_fourcc为视频编解码器
#fourcc意为四字符代码(Four-Character Codes),顾名思义,该编码由四个字符组成,下面是VideoWriter_fourcc对象一些常用的参数,注意:字符顺序不能弄混
# cv2.VideoWriter_fourcc('I', '4', '2', '0'),该参数是YUV编码类型,文件名后缀为.avi
# cv2.VideoWriter_fourcc('P', 'I', 'M', 'I'),该参数是MPEG-1编码类型,文件名后缀为.avi
# cv2.VideoWriter_fourcc('X', 'V', 'I', 'D'),该参数是MPEG-4编码类型,文件名后缀为.avi
# cv2.VideoWriter_fourcc('T', 'H', 'E', 'O'),该参数是Ogg Vorbis,文件名后缀为.ogv
# cv2.VideoWriter_fourcc('F', 'L', 'V', '1'),该参数是Flash视频,文件名后缀为.flv
out = cv2.VideoWriter('output.avi', fourcc, 20.0, (640, 480)) #设置视频参数, 20为帧播放速率,640x480是视频输出窗口大小
while True:
ret, frame = cap.read()
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) #转为灰度
out.write(frame) #写入视频
cv2.imshow('frame', frame) #彩色显示
cv2.imshow('gray', gray) #灰度显示
if cv2.waitKey(1) & 0xFF == ord('q'): #按q退出程序
break
cap.release()
out.release()
cv2.destroyAllWindows()
这段代码的目的就是获取摄像头的视频流,然后保存到本地,帧率是 20fps,尺寸是 640x480.
需要注意的是在 VideoWriter 中指定的尺寸要和 write() 中写进去的一样,不然视频会存储失败的。
如果需要读取视频文件,那么就将 VideoCapture 指定文件路径。