从零开始在单一环境中学习一个任务,依赖于非常细致的监督和指导,不能扩展到许多不同的任务。这不仅是机器人学习和强化学习的问题,比如学习玩游戏和运动,需要大量的数据,以奖励的形式进行大量监督。
这门课的内容就是学习一个更全面的系统。

  • 为何我们关心深度多任务和元学习?

我们从深度学习中学到,大型且多样化的数据集能够实现广泛的推广。
当没有一个大型且多样的数据集时就有麻烦了, 比如医学成像,机器人技术,医学推荐系统,翻译系统。因此从头学习每种疾病,每个机器人,每一种语言,每一个任务,是不实际的。因此取而代之的是这些多任务学 习技巧。

  • 除了没有大数据集的设置之外,如果数据分布是长尾分布long tail呢?

这也是汽车自动驾驶的一个大问题,可以处理各种各样的非常普通的情况,但当它们看到非常奇怪的情况时,人类完全可以驾驭它们,但是汽车很难驾驭。
image.png

  • 如果需要快速学习一些新东西呢(如果有以前的知识)

关于一个人,一个新的任务,一个新的环境,没有从零开始的训练。

总结

多任务学习的环境,可以帮助我们,基本上使机器学习在这种情况下更有效。
image.png

什么是任务

基本上你可以把一个任务看作是一个机器学习问题。
你有一个数据集,一个损失函数,为了生成一个模型,你需要优化一个损失函数。
不同的任务可以是不同损失函数相同数据集,等等,是个流动的概念。
image.png

关键假设

在多任务学习和元学习中的关键假设。

  • The bad news:不同任务需要共享某些结构为了从这些算法中获益。如果你试图学习的任务没有共享任何结构,那么最好使用单任务学习。
  • The good news:有很多任务有共享的结构。
    • 比如“拧瓶盖和研磨胡椒粉”,物理规律是真实数据的基础。

image.png
元学习是学习潜在任务的结构,这样你就能更快地学会一项新任务。如果没有共享结构,那么你学习的速度就不会比从零开始快了。

正式的问题定义

  • 多任务学习问题:更快或更熟练学习所有给你的任务,相比于独立学习任务。
  • 元学习问题:给定一组之前任务上的数据或经验,通过充分利用你在之前任务中的经验,比从零开始学习更快或更熟练的学习一个新任务。

本课程会涉及解决上述问题陈述的任何东西。

Q&A

  • 元学习和迁移学习的不同
  • 元学习和领域适应domain adaption问题的不同

元学习问题中,测试时的任务分布和训练时的一样(?)。领域适应技术考虑的设置是你的任务域可能与你在训练中看到的不一致。