1_Gn67FLVSiYsnUaU1g1TgFw.png
构建机器学习系统在其生命周期的许多方面与传统软件开发不同。当应用于机器学习模型时,用于测试,调试和故障排除结果的已建立的软件方法是不切实际的。虽然传统软件组件(如网站,移动应用程序或API)的行为完全由其代码决定,但机器学习模型会根据特定数据集随时间推移其知识。如何定义和编写健壮的机器学习代理是整个空间存在的挑战之一。最近,DeepMind的人工智能(AI)研究人员一直在探索一些有关的想法.

当我们考虑编写健壮的软件时,我们会立即关注两个根据预定义规范行为的代码。在机器学习的情况下,没有正确的规范或稳健行为的既定定义。公认的做法是使用特定数据集训练机器学习模型,并使用不同的数据集对其进行测试。这种方法非常有效,可以在两个数据集中实现高于平均水平的行为,但在边缘情况下并不总是有效的。这些挑战的典型例子是在图像分类模型中看到,可以通过在输入数据集中引入人眼完全察觉不到的小变化来完全破坏这些模型。
机器学习模型中的鲁棒性概念应该不仅仅能够很好地对抗训练和测试数据集,而且还应该根据描述系统理想行为的预定义规范集来表现。使用我们之前的示例,需求规范可能会详细说明机器学习模型针对对抗性扰动或给定的一组安全约束的预期行为。
编写健壮的机器学习程序是从准确的训练数据集到有效的优化技术的许多方面的组合。然而,大多数这些过程可以作为三个主要支柱的变体模型,构成DeepMind研究的核心焦点:
1_-CpeRbiAecFw0RGCN3Yllg.png

  1. 测试与规范的一致性:测试机器学习系统与设计者和系统用户所需的属性(例如不变性或鲁棒性)一致的技术。
  2. 训练机器学习模型是规范一致的:即使有大量的训练数据,标准机器学习算法也可以产生预测模型,使预测与健壮或公平等理想规范不一致 - 这要求我们重新考虑培训算法,这些算法不仅适合模型训练数据很好,但也符合规范列表。
  3. 正式证明机器学习模型是规范一致的:需要能够验证模型预测可证明与所有可能输入的感兴趣的规范一致的算法。虽然形式验证领域几十年来一直在研究这种算法,但这些方法虽然取得了令人瞩目的进展,但却不能轻易地扩展到现代深度学习系

规格测试

对抗性示例是针对给定规范集测试机器学习模型的行为的一种很好的机制。不幸的是,对抗训练中的大部分相关工作都局限于图像分类模型。将一些想法扩展到更加通用的领域,例如强化学习,可以提供一种通用机制来测试机器学习模型的稳健性。
根据对抗训练的一些想法,DeepMind为RL代理的对抗性测试开发了两种互补的方法。第一种技术使用无衍生优化来直接最小化代理的预期回报。第二种方法学习对抗值函数,该函数根据经验预测哪种情况最有可能导致代理失败。然后将学习的函数用于优化,以将评估集中在最有问题的输入上。这些方法只构成了丰富且不断增长的潜在算法空间的一小部分,我们对严格评估代理的未来发展感到兴奋。
1_6wod7-n06czhtFwWLoV8OQ.gif
对抗方法与强化学习代理中的传统测试方法相比显示出明显的改进。对抗性测试揭示了通常未被注意到的错误,同时也在代理中表现出基于训练数据集的组成而未预期的定性行为。例如,下图显示了对抗训练在3D导航任务中的效果。即使代理可以达到人类级别的性能,对抗训练也表明它仍然可以在超级简单的任务中失败。

规范训练

对抗性测试非常有效地检测错误,但仍然无法发现偏离给定规范的示例。如果我们从机器学习的角度考虑需求的概念,可以将它们建模为输入和输出之间的数学关系。使用这个想法,DeepMind团队创建了一个方法,通过使用下限和上限几何计算模型与给定规范的一致性。称为区间绑定传播,DeepMind的方法将规范映射到有界框,可以在网络的每个层上进行评估,如下图所示。该技术被证明可以降低各种机器学习模型中可证明的错误率。
1_UCBYfd1EJI6oLU-ZsAR_tw.gif

正式验证

准确的测试和培训是实现机器学习模型稳健性的必要步骤,但在很大程度上不足以确保系统按照其期望行事。在大规模模型中,由于输入扰动的选择具有天文数,因此列举给定输入集的所有可能输出(例如,对图像的无穷小扰动)是难以处理的。形式验证技术是一个活跃的研究领域,其重点是找到基于给定规范设置几何边界的有效方法。
DeepMind最近开发了一种形式验证方法,该方法将验证问题建模为优化问题,该问题试图找到被验证属性的最大违规。该技术迭代几次,直到找到正确的边界,间接保证不会再违反给定的属性。虽然最初应用于强化学习模型,但DeepMind的方法很容易推广到其他机器学习技术。
1_8CFxAxyAYk_4iuXHTQGc4Q.gif
测试,培训和规范的形式验证的组合构成了实施强大的机器学习模型的三个关键支柱。DeepMind创意是一个很好的起点,但我们应该期望这些概念演变成功能数据集或框架,以便建立和验证与机器学习模型相关的规范。通过机器学习也可以实现强大的机器学习之路。