doc - domain_adaptation - 《YT库》

Domain adaptation介绍及代表性文章梳理

Domain adaptation介绍及代表性文章梳理

Domain adaptation，DA，中文可翻译为域适配、域匹配、域适应，是迁移学习中的一类非常重要的问题，也是一个持续的研究热点。Domain adaptation可用于计算机视觉、物体识别、文本分类、声音识别等常见应用中。这个问题的基本定义是，假设源域和目标域的类别空间一样，特征空间也一样，但是数据的分布不一样，如何利用有标定的源域数据，来学习目标域数据的标定？
事实上，根据目标域中是否有少量的标定可用，可以将domain adaptation大致分为无监督（目标域中完全无label）和半监督（目标域中有少量label）两大类。我们这里偏重介绍无监督。
视觉domain adaptation综述
关于迁移学习的理论方面，有三篇连贯式的理论分析文章连续发表在NIPS和Machine Learning上：理论分析

形式化

给定：有标定的 $domain_adaptation - 图1$ ，以及无标定的 $domain_adaptation - 图2$
求： $domain_adaptation - 图3$ 的标定 $domain_adaptation - 图4$ （在实验环境中， $domain_adaptation - 图5$ 是有标定的，仅用来测试算法精度）
条件：

$domain_adaptation - 图6$ ，即源域和目标域的特征空间相同（都是 $domain_adaptation - 图7$ 维）
$domain_adaptation - 图8$ ，即源域和目标域的类别空间相同
$domain_adaptation - 图9$ ) $domain_adaptation - 图10$ $domain_adaptation - 图11$ )，即源域和目标域的数据分布不同

例子

比如说，同样都是一台电脑，在不同角度，不同光照，以及不同背景下拍照，图像的数据具有不同的分布，但是从根本上来说，都是一台电脑的图像。Domain adaptation要做的就是，如何根据这些不同分布的数据，很好地学习缺失的标定。

代表方法与文章

最新完整版请看这里)
Domain adaptation可以算是迁移学习领域最火的研究点了。因此，试图来解决此问题的方法层出不穷。从早期的基于实例的迁移、基于模型的迁移，到偏重数学变换的基于特征的迁移，再到如今的深度迁移，诞生了许多经典的DA方法。我们不打算面面俱到，也没有必要。在这里仅列出最经典的那些方法（何为最经典？引用量大且发表会议/刊物级别高），并在之后单独写文章深入介绍每个方法。时间有限，并且为了保证质量，不可能一次做完。
代表性的方法及文章：

迁移成分分析方法(Transfer component analysis, TCA)
Domain adaptation via tranfer component analysis
发表在IEEE Trans. Neural Network期刊上（现改名为IEEE trans. Neural Network and Learning System），前作会议文章发在AAAI-09上
我的解读

联合分布适配方法（joint distribution adaptation，JDA）
Transfer Feature Learning with Joint Distribution Adaptation
发表在2013年的ICCV上
我的解读

测地线流式核方法(Geodesic flow kernel, GFK)
Geodesic flow kernel for unsupervised domain adaptation
发表在CVPR-12上
我的解读

领域不变性迁移核学习(Transfer Kernel Learning, TKL)
Domain invariant transfer kernel learning
发表在IEEE Trans. Knowledge and Data Engineering期刊上

深度适配网络（Deep Adaptation Network, DAN）
发表在ICML-15上：learning transferable features with deep adaptation networks
我的解读

接下来会继续添加方法，以及开始对每种方法的细致说明