CVPR 之 老照片修复

周末闲来无事整理照片,望着一张张物是人非的老相片,勾起了斑驳的回忆。转念一想,何不 PS 下,但 Photoshop 有些大且不免费自己懒得装,于是,转向免费的图像复原软件。

网上搜来找去,一直没寻到合适的,最后查到 CVPR 2020 的一篇 Oral 论文,看到有的博客已经详细介绍过了,恰好作者也开放了源码,于是,一时兴起,拿这个来复原老相片。

结果,忙活了半晚上 (主要是用手机热点,时间浪费在了下载速度上) 加一上午 (踩了很多第三方库安装、python 向低版本重装的坑),终于成功复原图像,遂写下此博文,以免后来者重复踩坑 ......

1 CVPR 会议

CVPR 全称 IEEE Conference on Computer Vsion and Pattern Recongniton,是计算机视觉的三大顶会之一 (另两个是 ICCV 和 ECCV),由 IEEE 每年举办一次。2021年,按照 Google Scholar Metrics 排名,CVPR 已经成为全球影响力排名第四的顶级期刊会议,排在前面的有 《Nature》和《Science》

2 Oral 论文

2020年的 CVPR 会议,投稿 6656 篇论文,1470 篇被录用,接收率 22%,其中 335 篇选中 Oral,这篇《Bringing Old Photos Back to Life》属于 Oral 论文,含金量可见一斑,论文链接请点击

摘录实现的效果图,如下: 源码已开放,GitHub 链接:github.com/microsoft/B...

3 实践步骤

3.1 测试环境

Win64 中使用 PoweShell 终端,已安装 Python 3.9.9,安装过程中勾选 pip 选项: 可在 PowerShell 中输入 py --version,查看安装的 Python 版本

3.2 源码和模型

3.2.1 源码

如有 git 可用 git clone 命令,如下

bash 复制代码
git clone https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life.git 

也可直接下载 Source code: github.com/microsoft/B...

3.2.2 模型

  1. 下载 face_landmark 预训练模型,解压后放在 Face_Detection 目录下
bash 复制代码
cd Face_Detection/
wget http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
bzip2 -d shape_predictor_68_face_landmarks.dat.bz2
cd ../
  1. 下载 face_checkpoints 模型,解压后置于 Face_Enhancement 目录下
bash 复制代码
cd Face_Enhancement/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/face_checkpoints.zip
unzip face_checkpoints.zip
cd ../  
  1. 下载 global_checkpoints 模型,解压后置于 Global 目录下
bash 复制代码
cd Global/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/global_checkpoints.zip
unzip global_checkpoints.zip
cd ../

2)和 3) 也可通过 3.2.1 中的链接下载,解压后分别置于对应目录中

3.2.3 sync_batchnorm

下载 Synchronized-BatchNorm-PyTorch,将子文件夹 sync_batchnorm,拷贝到 Face_Enhancement/models/networks/ 目录下

bash 复制代码
cd Face_Enhancement/models/networks/
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../../

相同的 sync_batchnorm 文件夹,再拷贝到 Global/detection_models/ 目录下

bash 复制代码
cd Global/detection_models
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch  # no need doing git clone once again
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../ 

3.3 依赖库

3.3.1 第三方库

可直接使用 pip 和 requirements.txt,一键下载全部依赖库

pip install -r requirements.txt

requirements.txt 中的所有依赖库如下:其中,torch, torchvision 和 dlib 稍复杂,可在后面单独安装

arduino 复制代码
torch
torchvision
dlib
scikit-image
easydict
PyYAML
dominate>=2.3.1
dill
tensorboardX
scipy
opencv-python
einops
PySimpleGUI

3.3.2 Torch 和 Torchvision

Torch, Torchvision 和 Python,三者版本是有一定的对应关系,需要单独安装,关系图参考:github.com/pytorch/vis...
第一种方法,用 pip install torch==1.8.1 和 pip install torchvision==0.9.2 进行安装,但在 PowerShell 中,有时会因网络不稳定导致安装不成功 第二种方法,提前下载好对应的 .whl 版本,下载链接:download.pytorch.org/whl/torch_s...,然后,分别执行如下命令

pip install  torch-1.8.1+cpu-cp39-cp39-win_amd64.whl
pip install  torchvision-0.9.1+cpu-cp39-cp39-win_amd64.whl

安装成功后,可用如下命令查看版本

go 复制代码
import torch
print(torch.__version__)

查看到的版本是 torch 1.8.1+cpu 和 torchvision 0.9.1+cpu

3.3.3 dlib

直接使用 pip install dib,安装并不成功,建议先下载 .whl 文件,再通过 pip 来安装,下载链接:github.com/sachadee/Dl...

pip install dlib-19.22.99-cp39-cp39-win_amd64.whl

3.4 执行效果

此处使用普通电脑测试,没有 GPU,所以 "--GPU" 设为 "-1" 1) 对于带有划痕的照片,加选项 "--with_scratch" 2) 对于高分辨率的照片,加选项 "--HR"

css 复制代码
py run.py --input_folder ./test_images/old/ --output_folder ./output/ --GPU -1

翻拍的老相片,复原前后对比如下:尤其放大相片后,人脸的对比效果非常明显

4 其它方法

阅读一篇好的论文,显然比在网上搜索更加有效,从文末的效果对比可知,主流的图像复原方法有:DIP, CyleGAN, Sequential, Pix2Pix 和 Operation-wise Attention 等,也算是一个额外的收获吧。

参考资料

Bringing Old Photos Back to Life
照片修复-使用Bringing-Old-Photos-Back-to-Life

相关推荐
shansjqun几秒前
教学内容全覆盖:航拍杂草检测与分类
人工智能·分类·数据挖掘
狸克先生3 分钟前
如何用AI写小说(二):Gradio 超简单的网页前端交互
前端·人工智能·chatgpt·交互
会讲英语的码农11 分钟前
Git项目管理
gitee·github
baiduopenmap17 分钟前
百度世界2024精选公开课:基于地图智能体的导航出行AI应用创新实践
前端·人工智能·百度地图
小任同学Alex21 分钟前
浦语提示词工程实践(LangGPT版,服务器上部署internlm2-chat-1_8b,踩坑很多才完成的详细教程,)
人工智能·自然语言处理·大模型
新加坡内哥谈技术27 分钟前
微软 Ignite 2024 大会
人工智能
江瀚视野1 小时前
Q3净利增长超预期,文心大模型调用量大增,百度未来如何分析?
人工智能
带多刺的玫瑰1 小时前
Leecode刷题C语言之统计不是特殊数字的数字数量
java·c语言·算法
爱敲代码的憨仔1 小时前
《线性代数的本质》
线性代数·算法·决策树
陪学1 小时前
百度遭初创企业指控抄袭,维权还是碰瓷?
人工智能·百度·面试·职场和发展·产品运营