摘要

现在的发型数据集,例如Beauty e-Expect,对于开发实现计算机视觉模型来说太小了,特别是最近的像GAN这样的深度合成模型。在这篇文章中,贡献了一个名为 Hairstyle30K的大型数据集,拥有64中不同类型的3万张发型图片。为了能自动合成和修改图片中的发型,还提出了一种GAN模型,称为Hairstyle GAN(H- GAN)

介绍

发型能够展示一个人的性格,自信和观念。正因为如此,它是个人外形的一个重要部分。一个能够识别、合成、修改发型的计算机视觉模型将会有切实的用途。例如,客户可以在去理发店之前就上传自己的照片,然后合成不同的发型,以此找到最合适的那款。此外,发型识别模型可以在安保程序上识别一个人的身份特征。
现在在发型建模主要的努力主要集中在推荐合适的发型和交互式的用户编辑。但是,到现在为止还没有系统学习发型的努力并且还没有可用的能够处理不同发型建模任务的模型。一个原因是应为发型中有很大的差异,这就需要一个很大的数据集。在多媒体和计算机视觉社区,发型通常是人脸数据集的一部分。但是,这些标注经常是粗糙的,更多的关注头发长度和颜色上。另一方面,现存的一些像Beauty e-Expert数据集用来表征自然环境下发型的多样性是太小的。
在这篇文章中,我们介绍了第一个大型发型数据集——Hairstyle30K。数据集中的图像是从网上收集的,通过在搜索引擎中搜索发型关键词。一共有64类,共30K张图片。平均下来,每类发型有大约480张图片。
除了发布一个新数据集,我们还发布了一个发型对抗生成网络模型,他可以用来自动生成或者编辑发型。我们的H-GAN有三个部分,编码子网络,它是VAE的一个变形;识别子网络