image.png
一句话总结:metric learning希望使同源的向量相似度尽可能的高,而非同源的向量相似度尽可能的低,即类内相近,类间分离。经典的应用就是人脸识别。通过计算两张图片之间的相似度,使得输入图片被归入到相似度大的图片类别中去。

Metric learning is an approach based directly on a distance metric that aims to establish similarity or dissimilarity between objects. While metric learning aims to reduce the distance between similar objects, it also aims to increase the distance between dissimilar objects. —-Deep Metric Learning: A Survey

为什么需要度量学习?

传统的分类任务(比如MINIST和ImageNet等),有一个很强但也很隐蔽的先验,即测试集中的类别一定在训练集类别中,此时模型已经学到了不同类之间的分界面。然而在人脸识别、指纹识别等开集分类的任务中,此先验不再成立,类别数往往很多而类内样本数比较少。在这种情况下,基于深度学习的分类方法常表现出一些局限性,如缺少类内约束、分类器优化困难等。而这些局限可以通过 Deep Metric Learning 来解决。
image.png

度量学习的目标?

除了保证可分性外,还要做到特征向量类内尽可能紧凑,类间尽可能分离。相当于引导分类器可以学习到能区分不同类的特征组合。Metric learning的关键在于distance metric,可以用下图去描述了:
image.png