Domain adaptation介绍及代表性文章梳理

Domain adaptation,DA,中文可翻译为域适配、域匹配、域适应,是迁移学习中的一类非常重要的问题,也是一个持续的研究热点。Domain adaptation可用于计算机视觉、物体识别、文本分类、声音识别等常见应用中。这个问题的基本定义是,假设源域和目标域的类别空间一样,特征空间也一样,但是数据的分布不一样,如何利用有标定的源域数据,来学习目标域数据的标定?
事实上,根据目标域中是否有少量的标定可用,可以将domain adaptation大致分为无监督(目标域中完全无label)和半监督(目标域中有少量label)两大类。我们这里偏重介绍无监督。
视觉domain adaptation综述
关于迁移学习的理论方面,有三篇连贯式的理论分析文章连续发表在NIPS和Machine Learning上:理论分析


形式化

给定:有标定的domain_adaptation - 图1,以及无标定的domain_adaptation - 图2
求:domain_adaptation - 图3的标定domain_adaptation - 图4 (在实验环境中,domain_adaptation - 图5是有标定的,仅用来测试算法精度)
条件:

  • domain_adaptation - 图6,即源域和目标域的特征空间相同(都是domain_adaptation - 图7维)
  • domain_adaptation - 图8,即源域和目标域的类别空间相同
  • domain_adaptation - 图9)domain_adaptation - 图10 domain_adaptation - 图11),即源域和目标域的数据分布不同

例子

比如说,同样都是一台电脑,在不同角度,不同光照,以及不同背景下拍照,图像的数据具有不同的分布,但是从根本上来说,都是一台电脑的图像。Domain adaptation要做的就是,如何根据这些不同分布的数据,很好地学习缺失的标定。
Domain adaptation


代表方法与文章

最新完整版请看这里)
Domain adaptation可以算是迁移学习领域最火的研究点了。因此,试图来解决此问题的方法层出不穷。从早期的基于实例的迁移、基于模型的迁移,到偏重数学变换的基于特征的迁移,再到如今的深度迁移,诞生了许多经典的DA方法。我们不打算面面俱到,也没有必要。在这里仅列出最经典的那些方法(何为最经典?引用量大且发表会议/刊物级别高),并在之后单独写文章深入介绍每个方法。时间有限,并且为了保证质量,不可能一次做完。
代表性的方法及文章:

  • 深度适配网络(Deep Adaptation Network, DAN)

  • 发表在ICML-15上:learning transferable features with deep adaptation networks

  • 我的解读

接下来会继续添加方法,以及开始对每种方法的细致说明