低偏差分类器才能确保大量样本数据的需要人工数据合成不适用于所有的问题 将图像处理成灰度图像对这个问题会更有帮助利用计算机中的字体库,站贴在一个背景中,可以获得大量训练样本同时配合模糊算子,放大缩小,旋转等理论上可以获得无限多的训练样本 另外一种方法:使用现有的样本生成数据 在一张真实样本值操作,借助网格,拉伸扭曲图片 语音识别的人工样本 有意义的制作人工数据 生成的样本应当具备代表性