S04-降维 - S04P02-多维缩放 - 《机器学习》

多维缩放(MDS)

多维缩放(MDS)

多维缩放(multidimensional scaling ,MDS)，是另外一种线性降维方式，与主成分分析法不同的是，多维缩放的目标不是保留数据的最大可分性，而是更加关注高维数据内部的特征。多维缩放算法集中于保留高维空间中的“相似度”信息，而在一般的问题解决的过程中，这个“相似度”通常用欧式距离来定义

多维缩放方法要求原始空间的样本之间的相似度在低维空间中得以保持，即原始空间的样本之间的距离与在低维空间中的距离相同

给定一个的样本集合 $S04P02-多维缩放 - 图1$

$S04P02-多维缩放 - 图2$

设样本之间的距离矩阵为 $S04P02-多维缩放 - 图3$ ，其第 $S04P02-多维缩放 - 图4$ 行第 $S04P02-多维缩放 - 图5$ 列元素 $S04P02-多维缩放 - 图6$ 表示样本 $S04P02-多维缩放 - 图7$ 与 $S04P02-多维缩放 - 图8$ 之间的距离。假设 $S04P02-多维缩放 - 图9$ 降维到低维空间后对应为低维空间中的为 $S04P02-多维缩放 - 图10$

$S04P02-多维缩放 - 图11$

令 $S04P02-多维缩放 - 图12$ ，即 $S04P02-多维缩放 - 图13$ 是 $S04P02-多维缩放 - 图14$ 的内积矩阵， $S04P02-多维缩放 - 图15$ ，多维缩放的目的是保证降维前后样本间距相等即 $S04P02-多维缩放 - 图16$ ，则有

$S04P02-多维缩放 - 图17$

不妨设降维后样本 $S04P02-多维缩放 - 图18$ 已被中心化，即 $S04P02-多维缩放 - 图19$ ，矩阵 $S04P02-多维缩放 - 图20$ 第 $S04P02-多维缩放 - 图21$ 列的和为

$S04P02-多维缩放 - 图22$ %5C%5C%0A%26%3D0%0A%5Cend%7Baligned%7D%0A#card=math&code=%5Cbegin%7Baligned%7D%0A%5Csum%7Bi%3D1%7D%5ENb%7Bij%7D%26%3D%5Csum%7Bi%3D1%7D%5ENZ_i%5ETZ_j%5C%5C%0A%26%3D%5Csum%7Bi%3D1%7D%5EN%5Csum%7Bk%3D1%7D%5Eqz%7Bik%7Dz%7Bjk%7D%5C%5C%0A%26%3D%5Csum%7Bk%3D1%7D%5Eqz%7Bjk%7D%5Cleft%28%5Csum%7Bi%3D1%7D%5ENz_%7Bik%7D%5Cright%29%5C%5C%0A%26%3D0%0A%5Cend%7Baligned%7D%0A&height=185&width=197)

同理矩阵 $S04P02-多维缩放 - 图23$ 第 $S04P02-多维缩放 - 图24$ 行的和 $S04P02-多维缩放 - 图25$ 。即矩阵 $S04P02-多维缩放 - 图26$ 每行或每列的和均为零，于是距离矩阵第 $S04P02-多维缩放 - 图27$ 列的和为

$S04P02-多维缩放 - 图28$ %2BNb%7Bjj%7D%0A%5Cend%7Baligned%7D%0A#card=math&code=%5Cbegin%7Baligned%7D%0A%5Csum%7Bi%3D1%7D%5ENd%7Bij%7D%5E2%26%3D%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%2B%5Csum%7Bi%3D1%7D%5ENb%7Bjj%7D-2%5Csum%7Bi%3D1%7D%5ENb%7Bij%7D%5C%5C%0A%26%3D%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%2BNb%7Bjj%7D%5C%5C%0A%26%3Dtr%28B%29%2BNb_%7Bjj%7D%0A%5Cend%7Baligned%7D%0A&height=131&width=261)

同理距离矩阵第 $S04P02-多维缩放 - 图29$ 行的和为

$S04P02-多维缩放 - 图30$ %2BNb%7Bii%7D%0A#card=math&code=%5Csum%7Bj%3D1%7D%5ENd%7Bij%7D%5E2%3Dtr%28B%29%2BNb%7Bii%7D%0A&height=55&width=160)

距离矩阵所有元素的和为

$S04P02-多维缩放 - 图31$ %2BNb%7Bii%7D)%5C%5C%0A%26%3D%5Csum%7Bi%3D1%7D%5ENtr(B)%2BN%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%5C%5C%0A%26%3D2Ntr(B)%0A%5Cend%7Baligned%7D%0A#card=math&code=%5Cbegin%7Baligned%7D%0A%5Csum%7Bi%3D1%7D%5EN%5Csum%7Bj%3D1%7D%5ENd%7Bij%7D%5E2%26%3D%5Csum%7Bi%3D1%7D%5EN%28tr%28B%29%2BNb%7Bii%7D%29%5C%5C%0A%26%3D%5Csum%7Bi%3D1%7D%5ENtr%28B%29%2BN%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%5C%5C%0A%26%3D2Ntr%28B%29%0A%5Cend%7Baligned%7D%0A&height=131&width=251)

又因为

$S04P02-多维缩放 - 图32$ %3D%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%3D%5Csum%7Bi%3D1%7D%5ENZ_i%5ETZ_i%3D%5Csum%7Bi%3D1%7D%5EN%7C%7CZi%7C%7C%5E2%0A#card=math&code=tr%28B%29%3D%5Csum%7Bi%3D1%7D%5ENb%7Bii%7D%3D%5Csum%7Bi%3D1%7D%5ENZi%5ETZ_i%3D%5Csum%7Bi%3D1%7D%5EN%7C%7CZ_i%7C%7C%5E2%0A&height=53&width=288)

令距离矩阵第 $S04P02-多维缩放 - 图33$ 行的平方和的均值为 $S04P02-多维缩放 - 图34$

$S04P02-多维缩放 - 图35$

令距离矩阵第 $S04P02-多维缩放 - 图36$ 列的平方和的均值为 $S04P02-多维缩放 - 图37$

$S04P02-多维缩放 - 图38$

令距离矩阵所有元素平方和的均值为 $S04P02-多维缩放 - 图39$

$S04P02-多维缩放 - 图40$

综上可得

$S04P02-多维缩放 - 图41$ %0A#card=math&code=b%7Bij%7D%3D%7B1%5Cover2%7D%28d%7Bi%5Ccdot%7D%5E2%2Bd%7B%5Ccdot%20j%7D%5E2-d%7B%5Ccdot%5Ccdot%7D%5E2-d_%7Bij%7D%5E2%29%0A&height=37&width=202)

于是我们用样本的距离矩阵求出了样本降维后对应的内积矩阵 $S04P02-多维缩放 - 图42$ ，换句话说就是如果想要让降维前后距离矩阵不变等价于降维前后的内积矩阵不变
如果对 $S04P02-多维缩放 - 图43$ 做特征值分解有

$S04P02-多维缩放 - 图44$ diag(%5Clambda_1%2C%5Clambda_2%2C%5Ccdots%2C%5Clambda_N)(u_1%2Cu_2%2C%5Ccdots%2Cu_N)%5ET%0A#card=math&code=B%3DU%5CLambda%20U%5ET%3D%28u_1%2Cu_2%2C%5Ccdots%2Cu_N%29diag%28%5Clambda_1%2C%5Clambda_2%2C%5Ccdots%2C%5Clambda_N%29%28u_1%2Cu_2%2C%5Ccdots%2Cu_N%29%5ET%0A&height=23&width=491)

设矩阵 $S04P02-多维缩放 - 图45$ 有 $S04P02-多维缩放 - 图46$ 个不为零的特征值即 $S04P02-多维缩放 - 图47$ 中有 $S04P02-多维缩放 - 图48$ 个不为零的值，那么不妨设 $S04P02-多维缩放 - 图49$ 不为零，设 $S04P02-多维缩放 - 图50$ 是 $S04P02-多维缩放 - 图51$ 对应的特征向量，做如下分块可得

S04P02-多维缩放 - 图52

于是令 $S04P02-多维缩放 - 图53$ 即满足 $S04P02-多维缩放 - 图54$ ，至此我们计算出了降维后的样本

但是上述推导中有存在问题，矩阵 $S04P02-多维缩放 - 图55$ 的非零特征值个数 $S04P02-多维缩放 - 图56$ 不一定比原始空间维度 $S04P02-多维缩放 - 图57$ 小。事实上我们在使用时并不一定要求降维前后样本间距离一定相同，而是要求降维前后距离矩阵尽可能相同，根据之前推导这等价于让降维前后内积矩阵尽可能相同，那么我们可以舍弃内积矩阵较小的特征值，保证保留大部分的信息，因此实际可以选取 $S04P02-多维缩放 - 图58$ 个大特征值，其对应的特征向量组成的矩阵和对角阵相乘即为 $S04P02-多维缩放 - 图59$ 维空间的样本