原文来源:mitryulyanov.github、sites.skoltech.ru
作者:Dmitry Ulyanov、Andrea Vedaldi、Victor Lempitsky
「雷克天下」编译:嗯~阿童木呀、哆啦A亮

关于多少图像规复问题的示例结果。我们利用深度神经网络,但并不该用数据集对其进行演习或预演习。我们将它们用作构造化图像先验。
择要
深度卷积网络已经成为图像天生和规复的通用工具。一样平常来说,它们的出色性能归功于它们从大量样本图像中学习真实图像先验(image prior)的能力。而在本文中,相反的是,我们证明天生器网络的构造足以将大量的低等级图像统计先验捕获到任意学习中。为了做到这一点,我们展示了一个随机初始化的神经网络可以用作一个手动先验,并且可以在诸如去噪、超分辨率和修补等标准可逆问题上获取很好的性能表现。此外,同样的先验可以用来反演深度神经表征从而对其进行诊断,并且可以对基于“闪光—无闪光”输入对的图像进行规复。
除了多样化的运用之外,我们的方法突出了标准天生器网络架构所捕获的归纳偏差(inductive bias)。它还填补了两种通用的图像规复方法之间的鸿沟:即利用深度卷积网络的基于学习的方法和基于手动图像先验(如自相似性)的无学习方法。
紧张内容
在图像规复问题中,目标是把受损图像x0规复到原始图像x。这样的问题常常被描述为一个优化任务:
个中,E(x;x0)是数据项,R(x)是图像先验。数据项E(x; x0)常日很随意马虎设计成用于各种各样的问题中,如超分辨率、去噪、修复,而图像先验R(x)是一个具有寻衅性的问题。现在的趋势是通过利用大量的样本对卷积神经网络进行演习,从而用其捕获先验R(x)。
我们首先把稳到,对付一个满射g:θ↦x,理论高下面的过程等同于(1):
在实际运用中,g显著地改变了如何利用最优化方法搜索图像空间。除此之外,通过选择一个“好的”(可能是内射的)映射g,我们可以去除先验项。我们将g(θ)定义为fθ(z),个中f是深度卷积神经网络,参数θ和z是一个固定的输入,从而天生公式:
在这里,网络fθ被随机初始化,输入z被噪声添补并被固定。
换句话说,我们不是在图像空间中探求答案,而是在神经网络的参数空间中探求答案。我们强调,我们从不该用预演习网络或图像数据库。在规复过程中只利用破坏的图像x0。
有关详细信息,请参阅论文(https://sites.skoltech.ru/app/data/uploads/sites/25/2017/11/deep_image_prior.pdf)和补充资料(https://box.skoltech.ru/index.php/s/ib52BOoV58ztuPM)。
规复过程的可视化
方法比较
·W. Lai,J. Huang,N. Ahuja和M. Yang,“用于快速和精准的超分辨率的深度拉普拉斯金字塔网络(https://arxiv.org/abs/1704.03915)”CVPR,2017
·C. Ledig,L. Theis,F. Huszar,J. Caballero,A. Cunningham,A. Acosta,A. Aitken,A. Tejani,J. Totz,Z. Wang and W. Shi,“利用天生对抗网络的照片级真实感的单一图像超分辨率(https://arxiv.org/abs/1609.04802)”CVPR,2017
·J. Huang,A. Singh和N. Ahuja,“转换后的自我示范的单幅图像超分辨率(https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Huang_Single_Image_Super-Resolution_2015_CVPR_paper.pdf)”CVPR,2015
·D. Glasner,S. Bagon和M. Irani,“从单一图像到超分辨率(https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Huang_Single_Image_Super-Resolution_2015_CVPR_paper.pdf)”ICCV,2009
·V. Papyan,Y. Romano,J. Sulam和M. Elad,“通过本地处理进行卷积词典学习(https://arxiv.org/abs/1705.03239)”,ICCV,2017
·K. Dabov,A. Foi,V. Katkovnik和K. Egiazarian,“通过稀疏三维变换域协同过滤给图像去噪(https://www.cs.tut.fi/~foi/GCF-BM3D/BM3D_TIP_2007.pdf)”TIP,2007
·A. Buades,B. Coll和J. M. Morel,“用于图像去噪的非局部算法(http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.374.7899&rep=rep1&type=pdf)”,CVPR,2005
·J. Ren,L. Xu,Q. Yan和W. Sun,“Shepard卷积神经网络(https://papers.nips.cc/paper/5774-shepard-convolutional-neural-networks.pdf)”NIPS,2015
有关论文总结
在论文中,我们研究了卷积网络体系构造在当前基于ConvNet的图像规复方法取得的成功中所扮演的角色。在这个过程中,我们提出了一种大略的方法,将随机初始化的ConvNets拟合到破坏的图像中从而作为修复问题的“瑞士刀(Swiss knife)”。利用这种“瑞士刀”不须要对这种降解(degradation)或预演习过程进行建模。无可否认的是,这种方法须要承载很大的打算量(对付512x512图像须要多少分钟的GPU打算)。
文章前部分所描述的:与当前两种修补方法所进行的比较。顶部:与Shepard网络进行的文本修复样本的比较。底部:与卷积稀疏编码(convolutional sparse coding)进行的修复50%缺失落像素的比较。在这两种情形下,我们的方法在干系论文中利用的图像上表现较好。
从很多方面来说,我们的研究结果与一样平常的结论所有相悖,即认为最近基于深度学习的方法在成像技能中所取得的成功,紧张归因于从利用手动先验到从数据中学习所有东西的转变。而事实证明,大部分的成功也可能是归因于从糟糕的手动先验转变为更好的手动先验(隐蔽在可学习的深度卷积神经网络中)。而这也证明了开拓新的深度学习架构的主要性。
论文下载:https://sites.skoltech.ru/app/data/uploads/sites/25/2017/11/deep_image_prior.pdf
代码:https://github.com/DmitryUlyanov/deep-image-prior