35. 超越人类表现水平

你正在进行语音识别的研究并有一个音频剪辑的数据集。假设你的数据集有很多的噪声音频片段,以至于人能达到的最好表现的误差都有 10%。 这个时候假设你的系统的误差有 8% 的话。那能否使用第 33 节的描述的三种技术中的任何一种来继续加速研发速度呢?

如果你可以确认在一些数据子集中,人类表现水平要远好于你的系统表现水平,例如,在你的系统中,识别嘈杂环境中的音频性能表现要好于人类表现,然而在转录那些语速非常快的音频片段中人类表现则比机器表现要好。那么你依然可以使用这些技术手段去推动研究进度。

对于上述表述的语速非常快的音频数据子集:

  1. 你仍然可以从人类中获得质量高于你算法的输出的转录文本;
  2. 你可以借鉴人类的直觉来理解为什么你的系统没能够正确听出语速非常快的音频片段;
  3. 你可以将快速语音音频片段下的人类水平表现作为期望表现目标。

更一般的说,只要在开发集中,你是正确的而算法是错误的,那么前面描述的许多技术都能适用。这是真话,即使在整个开发/测试集的平均水平上,你的算法的表现已经超过了人类的性能表现。

有很多重要的机器学习应用程序,其中机器的表现超过了人类的表现。例如,机器在预测电影评级、对送货车在某地驾驶时长的预测、或者是评断是否批准申贷人的贷款申请等方面的效果都要比人类表现更好。一旦人类很难识别出算法明显出错的例子,那么只有一部分技术能用上。因此,在机器表现已经超越人类表现的问题上,研发进展通常较慢。而在当机器的表现不能够和人类表现媲美的情况下,进展较快。