DPN(Deep Parsing Network)使用现有的CNN来完成一元问题,然后又精心设计了其他层来模拟平均场算法的二元问题。DPN的优点如下:

    • 在综合使用了CNN和随机场的一般工作中,需要对随机场做多次迭代,然而DPN只做一次迭代就可以获得比较好的效果。
    • DPN同时考虑了空间上下文关系如高阶关系,有能力对各种二元问题进行建模,使得很多二元问题成为DPN的特例。
    • DPN使得马尔可夫场问题能够并行化解决,通过GPU来加速计算。DPN使用卷积和池化操作来近似MF,可以通过近似来加速。

    二元势函数都是通过考虑任意两个像素点之间的关系来构造的。如DPN - 图1中的DPN - 图2表示像素点DPN - 图3是否被标记为DPN - 图4DPN - 图5表示像素点DPN - 图6DPN - 图7之间的关系,比如RGB像素点的距离或者空间距离;DPN - 图8则表示DPN - 图9DPN - 图10这两个标记全局共现的惩罚。在空间上相近且看起来相似的两个点,应该更容易获得相同的标签。然而这种建模方式的两个缺点:(1)它只考虑了共现的频率,却没有考虑空间上下文关系,比如,当人和椅子一起出现的时候,人应该是坐在椅子上的,而不太可能在椅子下;(2)它只考虑了像素点之间成对(Pairwise)的关系,却没有考虑更高阶的关系。为了解决这些缺点,在二元势函数中引入了三元惩罚项:

    DPN - 图11

    这个式子学习了局部标记上下文的混合。DPN - 图12是混合组件的数量,DPN - 图13取值为DPN - 图14DPN - 图15,表示哪个组件被激活,且DPN - 图16。如下图(b)所示,红色点和蓝色点描述了中心点DPN - 图17和它的邻域DPN - 图18DPN - 图19表示像素点DPN - 图20被标记为DPN - 图21DPN - 图22表示根据DPN - 图23DPN - 图24的相对关系,DPN - 图25DPN - 图26同时存在的代价。上式的第二项就为三元惩罚项,表示像素点DPN - 图27DPN - 图28以及DPN - 图29的邻域的关系。当DPN - 图30DPN - 图31相容时,DPN - 图32也应该相容于DPN - 图33,其中DPN - 图34DPN - 图35的邻域,如下图(a)所示。所以DPN的主要贡献就是把上式分两步建模成CNN。第一步如图(c)所示,用DPN - 图36的卷积核作用于每个点DPN - 图37来表示DPN - 图38,平滑了像素点DPN - 图39和它的邻域之间的预测。第二步使用DPN - 图40的卷积核作用于每个点DPN - 图41来表示DPN - 图42,如图(d)所示。

    DPN.png