• 低偏差分类器才能确保大量样本数据的需要
    • 人工数据合成
    • 不适用于所有的问题

    image.png
    image.png image.png

    • 将图像处理成灰度图像对这个问题会更有帮助
    • 利用计算机中的字体库,站贴在一个背景中,可以获得大量训练样本
    • 同时配合模糊算子,放大缩小,旋转等
    • 理论上可以获得无限多的训练样本

    • 另外一种方法:使用现有的样本生成数据

    • 在一张真实样本值操作,借助网格,拉伸扭曲图片

    image.png

    • 语音识别的人工样本

    image.png

    • 有意义的制作人工数据

    image.png

    • 生成的样本应当具备代表性

    image.png