SeerNet

ReLU将负值直接置零, Maxpooling直接将小值去掉, 所以这些值就不去计算, 进而节省计算占用, 实现了特征图的稀疏.

不同的层可能需要使用比特数也不一定相同.

图卷积网络实现多标签图像分类

相较于传统的图像识别, 这类图像中会存在多类目标. 例如细胞图片中各种酶的识别等. 甚至可以用在电影推荐上.

一般思路:
训练若干个二分类分类器. 但是二分类导致输出空间会随着类别的增加而急剧扩增.

多分类关键是如何确定各个类别之间的关联.

这里使用GCN关系度量的能力来实现关系推理.

CNN -> 一维向量->GCN(进行了一个分类, 学习到了node到分类器的一个映射)->计算多标签的损失.

image.png

可见, 这里使用的是谱方法.

使用了条件概率构建了图, 因为一些类别的出现之间存在依赖关系.

自编码器中的自编码器(嵌套式自编码器)

image.png

内层提取本质信息, 外层融合多元信息.
image.png

内层编码器:特定视角自编码网络, 学习对于更好的视角特定表示的潜在表示. 外层编码器学习更好的潜在表示来约束学习到的特定视角表示.

探索视觉关系检测中的未确定关系

image.png

image.png

滑窗滤波器

传统滤波器的改进.

image.png

会实现很好的保边效果.

image.png

传统的滤波研究都在研究第二步, 这里关注第一步. 研究的是窗口的设计.

image.png

image.png

image.png

image.png

可以改进之前所有的算法…, 因为他们都是在第二步上做, 这里做的第一步.