图像增强：Learning to See in the Dark

【飞桨论文复现挑战赛】本项目是用百度飞桨框架paddlepaddle复现：Learning to See in the Dark in CVPR 2018

AI Studio

947人浏览 · 2021-11-18 14:31:16

AI Studio · 2021-11-18 14:31:16 发布

SID-Paddle

一、简介

【飞桨论文复现挑战赛】
本项目是用百度飞桨框架paddlepaddle复现：Learning to See in the Dark in CVPR 2018, by Chen Chen, Qifeng Chen, Jia Xu, and Vladlen Koltun.

原代码地址：Learning-to-See-in-the-Dark

论文：Learning to See in the Dark

这篇论文最大的贡献之一就是提供了一个真实世界的低光照图像和对应reference的数据集，但这些图像不是传统的类型，属于raw sensor data，低光照图像是短曝光下得到的，对应的ref为长曝光，SID数据集总共包含5094对。图像由两部相机Sony α7S II 和Fujiﬁlm X-T2拍摄得到，其对应的传感器分别为Bayer和X-Trans，得到的图像分辨率为4240×2832和6000×4000。
本文提出了一个端到端的网络结构，直接处理低光照的raw data，包括色彩变化、去马赛克、减少噪声和图像增强，网络结构如下：

(a)为传统的图像处理流程，如白平衡、去马赛克、去噪、锐化、颜色空间转换、gamma变化等，这些一般针对特定的相机，泛化性能比较差，而且不能很好地处理极度低的SNR。(b)是本文中提出的结构，对于Bayer arrays把输入pack成4通道，对应的分辨率变为原来的一半；对于X-Trans arrays，输入为6/*6的block, pack成9通道。之后减去black level再乘上期望的放大因子，得到的图像作为网络的输入，默认使用U-Net结构，网络的输出为12通道、原图一半空间分辨率的如下，再经过sub-pixel层复原到全分辨率大小，且输出为RGB空间，网络使用L1loss。

二、复现精度

指标	原论文	原代码精度	复现精度
PSNR	28.88	28.96	28.82
SSIM	0.787	0.785	0.787

三、数据集

使用的数据集为：SID-Sony
注：如果只使用Sony数据集，只需要下载Sony开头的文件，下载结束后，使用"cat SonyPart* > Sony.zip"得到数据集压缩包。

请注意！根据原作者在原代码README中的描述，在进行定量评估时(运行eval.py之前)，需要删除10034，10045和10172这几组图片，因为这些图片对应的长短曝光图片有些许位移，会影响定量评估的结果。
数据集大小：包含2697个短曝光图像和231个长曝光图像，每一个短曝光图像都有一个对应的长曝光图像(ground truth)，多个短曝光图像可能对应同一个长曝光图像。
- 训练集：1865短曝光+161长曝光
- 验证集：234短曝光+20长曝光
- 测试集：598短曝光+50长曝光
数据集格式：本数据集使用RAW格式图片，jpg或者png等格式不支持本网络。

四、环境依赖

硬件：本项目在Paddle AI Studio平台 4卡Tesla V100, 128G显存上运行，训练4000 epoch需要约16小时。根据原作者称，显存大小最小需要64G
框架：
- Paddlepaddle >= 2.0.0
- rawpy
- scipy == 1.1.0

五、快速开始

step1: clone

# clone this repo
git clone git://github.com/WangChen0902/SID-Paddle.git

step2: 下载数据

将上文提到的数据集放到本项目data目录下，目录格式：SID-Paddle/data/Sony

step3: 训练

python train_Sony_paddle.py  # 单卡
python -m paddle.distributed.launch train_Sony_paddle.py  # 单机多卡

step3: 测试

python test_Sony_paddle.py

step4: 评估

python eval.py

六、代码结构与详细说明

6.1 代码结构

├── checkpoint  # 存放模型文件的路径
├── data  # 存放数据集的路径
├── result  # 存放程序输出的路径
├── utils  # 工具类
│   ├── PSNR.py
│   └── SSIM.py
├── eval.py  # 评估程序，计算PSNR/SSIM
├── README.md
├── run.sh  # AI Studio 单机多卡训练运行脚本
├── run_test.sh  # 单机单卡测试脚本
├── test_Sony_paddle.py  # 测试程序
└── train_Sony_paddle.py  # 训练程序

6.2 参数说明

参数	默认值	说明
start_epoch	0	起始epoch值
num_epoches	4001	epoch次数
patch_size	512	用于训练的图片大小
save_freq	200	保存模型的频率
learning_rate	1e-4	学习率
DEBUG	0	是否开启调试
data_prefix	‘./data/’	数据集路径
output_prefix	‘./result/’	输出路径
checkpoint_load_dir	‘./checkpoint/’	读取模型的路径
last_epoch	4000	测试时读取哪一轮的模型

七、模型信息

信息	说明
作者	Wangchen0902
时间	2021.08
框架版本	Paddle 2.1.2
应用场景	图像增强
支持硬件	GPU>=64G
下载链接	预训练模型提取码：6hbx
下载链接	训练日志提取码：brfz
在线运行	SID-Paddle

八、复现心得

以下是我的复现心得： 1.paddlepaddle大部分的api和pytorch基本一致，基本的对齐方式就是将pytorch的api转换为同名的paddlepaddle的api。 2.存在一部分api存在不同名但同功能、同名同功能但不同参数、同名同参数但不同功能，这部分api可以参考飞桨提供的api对照文档进行转换。 3.如果存在完全没有对应的api，可以尝试去Tensorflowde api中寻找对应，例如paddle.where；或者使用numpy数组进行转换，例如paddle.gather。paddle的bool索引api比较简单，没有像pytorch那样高的集成度，与bool索引有关的代码基本都需要重新考虑。但是最新版本的paddle更新了这部分功能，点赞！
复现论文的步骤我认为可以主要分为以下几个方面：数据集的读取、网络的搭建、训练策略的设置、损失函数的构建以及测试与验证。在paddle中，数据集可以使用DataLoader，网络搭建使用paddle.nn.Layer，训练策略需要考虑所使用的优化器、各项训练参数（epoch、lr、batch size等），损失函数需要考虑网络输出结果的处理，loss的反向传播等。 Paddle是一个比较实用的深度学习框架，今后我还会继续学习与尝试。