학술논문

生成式对抗网络及其计算机视觉应用研究综述 / Review of computer vision based on generative adversarial networks
Document Type
Academic Journal
Source
中国图象图形学报 / Journal of Image and Graphics. 23(10):1433-1449
Subject
生成式对抗网络
计算机视觉
图像生成
图像风格迁移
图像修复
Language
Chinese
ISSN
1006-8961
Abstract
目的 生成式对抗网络(GAN)的出现为计算机视觉应用提供了新的技术和手段,它以独特零和博弈与对抗训练的思想生成高质量的样本,具有比传统机器学习算法更强大的特征学习和特征表达能力.目前在机器视觉领域尤其是样本生成领域取得了显著的成功,是当前研究的热点方向之一.方法 以生成式对抗网络的不同模型及其在计算机视觉领域的应用为研究对象,在广泛调研文献特别是GAN的最新发展成果基础上,结合不同模型的对比试验,对每种方法的基本思想、方法特点及使用场景进行分析,并对GAN的优势与劣势进行总结,阐述了GAN研究的现状、在计算机视觉上的应用范围,归纳生成式对抗网络在高质量图像生成、风格迁移与图像翻译、文本与图像的相互生成和图像的还原与修复等多个计算机视觉领域的研究现状和发展趋势,并对每种应用的理论改进之处、优点、局限性及使用场景进行了总结,对未来可能的发展方向进行展望.结果 GAN的不同模型在生成样本质量与性能上各有优劣.当前的GAN模型在图像的处理上取得较大的成就,能生成以假乱真的样本,但是也存在网络不收敛、模型易崩溃、过于自由不可控的问题.结论 GAN作为一种新的生成模型具有很高的研究价值与应用价值,但目前存在一些理论上的桎梏亟待突破,在应用方面生成高质量的样本、逼真的场景是值得研究的方向.