图像标注

参考文献:图像标注是什么?及其类型和应用 内容:

  • 图像标注分为:图像分类(只分辨图像是什么类别)、目标检测(不仅要分辨出类别,还要进行定位,不过检测框可以重叠)、语义分割(按像素进行分割,每个物体一个框,框不能重叠)

目标检测的标注方法可以分为:

  • 2D边界框(2D Bounding Box):标注员应用矩形和正方形来界定目标对象的位置。这是图像标注领域中常用的技术之一。
  • 三维长方体(Cuboid)或3D边界框(3D Bounding Box):标注员将立方体应用于目标对象,以界定对象的位置和深度。
  • 多边形分割(Polygonal Segmentation):当目标对象不对称且不容易放入盒子中时,标注员会使用复杂的多边形来界定对象的位置。
  • 线和样条线标注(Lines and Splines):标注员标识图像中的关键边界线和曲线以分隔各个区域。例如,标注员可以为自动驾驶汽车图像标注项目中标记高速公路的各个车道。

此外,还有一些其他的标注方式,例如人脸可以使用眼、嘴等部位来标注…

视频标注

参考资料: 视频标注是什么?和图像数据标注的区别? 视频标注技术

视频标注的方法:单一图像法(把视频一帧帧当成一个个图像,然后进行大量重复的标注工作)、连续帧法(使用自动化工具,通过连续帧法简化视频标注过程。计算机可以逐帧自动跟踪对象及其位置,从而保持所捕获信息的连续性和流畅性。计算机依靠诸如光学流之类的连续帧技术来分析前一帧和后一帧中的像素,并预测当前帧中像素的运动。)