如何使用GAN拯救你的低分辨率老照片

技术如何使用GAN拯救你的低分辨率老照片如何使用GAN拯救你的低分辨率老照片,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。 1 项目背景了解GAN的

如何用GAN保存你的低分辨率老照片,针对这个问题,本文详细介绍了相应的分析和解决方法,希望能帮助更多想要解决这个问题的小伙伴找到更简单更容易的方法。

1 项目背景

了解GAN的人都知道,GAN擅长捕捉概率分布,因此非常适合图像生成任务。在拍摄和传输图片和视频的过程中,我们经常会对图像进行压缩,导致图像的分辨率较低。此外,设备早些年拍摄的照片也存在分辨率低的问题,比如十年前的分辨率为320*240。为了解决这个问题,有必要使用图像超分辨率技术

我们用GAN来完成图像超分辨率的任务,需要做的准备工作包括:

(1) Linux系统还是windows系统,使用Linux更有效率。

(2)安装的Pytorch需要进行GPU训练。

2 原理简介

图像超分辨率任务的输入是低分辨率图像,输出是分辨率提高的图片。以下是常见的框架图[1]:

如何使用GAN拯救你的低分辨率老照片

该框架首先通过插值方法对输入图进行上采样,然后利用卷积层学习输入。这种框架的缺点是计算成本相对较高,因为整个网络运行在高分辨率的图上。

随后,研究人员提出在网络后端放大分辨率,扩大通道数量,然后重新分配以获得高分辨率图像。这个操作叫做(PixShuffle)[2],这样整个网络的大部分计算都是在低分辨率图像上进行的,如下图所示:

如何使用GAN拯救你的低分辨率老照片

以上构成了图像超分辨率的基本思想。之后,研究者将GAN纳入超分辨率框架[3],实际上增加了对抗损失,同时用我们常说的感知损失代替了重建的MSE损失。

至于各种超分辨率框架的具体原理,可以搬到有三个AI知识的星球,也可以自己学习。由于这是一个实用的专栏,我们将不完整地介绍原理。

3 模型训练

超分辨率重建任务的大部分数据集是通过从高分辨率图像下采样获得的。论文中经常选择ImageNet数据集。因为我们打算在这里还原人脸的清晰度,所以我们选择了一个常用的高清人脸数据集CelebA-HQ,它发布于2019年,包含了3万张不同属性的高清人脸图像,其中图像大小都是10241024。预览如下。

如何使用GAN拯救你的低分辨率老照片

接下来,我们解释代码:

3.1 数据预处理

图像超分辨率数据集往往是从高分辨率图像中采样得到低分辨率图像,然后形成图像对进行训练。以下是训练和验证集中数据处理的核心代码:

# #训练集高分辨率地图预处理功能。

def train_hr_transform(裁剪大小):

返回撰写([

随机作物(作物_

size),

        ToTensor(),

])

## 训练集低分辨率图预处理函数

def train_lr_transform(crop_size, upscale_factor):

    return Compose([

        ToPILImage(),

        Resize(crop_size // upscale_factor, interpolation=Image.BICUBIC),

        ToTensor()

    ])

## 训练数据集类

class TrainDatasetFromFolder(Dataset):

    def __init__(self, dataset_dir, crop_size, upscale_factor):

        super(TrainDatasetFromFolder, self).__init__()

        self.image_filenames = [join(dataset_dir, x) for x in listdir(dataset_dir) if is_image_file(x)] ##获得所有图像

crop_size = calculate_valid_crop_size(crop_size, upscale_factor)##获得裁剪尺寸

        self.hr_transform = train_hr_transform(crop_size) ##高分辨率图预处理函数

        self.lr_transform = train_lr_transform(crop_size, upscale_factor) ##低分辨率图预处理函数

##数据集迭代指针

    def __getitem__(self, index):

        hr_image = self.hr_transform(Image.open(self.image_filenames[index])) ##随机裁剪获得高分辨率图

        lr_image = self.lr_transform(hr_image) ##获得低分辨率图

        return lr_image, hr_image

    def __len__(self):

        return len(self.image_filenames)

## 验证数据集类

class ValDatasetFromFolder(Dataset):

    def __init__(self, dataset_dir, upscale_factor):

        super(ValDatasetFromFolder, self).__init__()

        self.upscale_factor = upscale_factor

        self.image_filenames = [join(dataset_dir, x) for x in listdir(dataset_dir) if is_image_file(x)]

关于如何使用GAN拯救你的低分辨率老照片问题的解答就分享到这里了,希望

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/52412.html

(0)

相关推荐

  • 立体爱心,怎样用吸管折星星拼出立体桃心

    技术立体爱心,怎样用吸管折星星拼出立体桃心1、先把吸管压平了,对折成一个直角,中心点会有一个小三角立体爱心。(打开时你会发现有一条斜的折痕) 2、把压在底下那根吸管折到上方,再把下面那根也折到上方。3、然后原本的小三角变

    生活 2021年10月24日
  • 衣补旁,衣补旁和四补旁有什么区别

    技术衣补旁,衣补旁和四补旁有什么区别一衣补旁、笔画数不同 1、四补旁:礻为示字旁,笔画数为四笔。 2、衣补旁:衤为衣字旁,笔画数为五笔。
    二、来源不同
    1、四补旁:同“示”。用作偏旁。俗称“示字旁”。
    2、衣补旁:

    生活 2021年10月24日
  • 如何进行Spring框架中的后置增强

    技术如何进行Spring框架中的后置增强这篇文章将为大家详细讲解有关如何进行Spring框架中的后置增强,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。在这一篇中我们看一下

    攻略 2021年12月2日
  • 如何解决JVM空闲堆内存不释放回OS的问题

    技术如何解决JVM空闲堆内存不释放回OS的问题今天就跟大家聊聊有关如何解决JVM空闲堆内存不释放回OS的问题,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。JDK

    攻略 2021年10月23日
  • PSQL常用函数汇总

    技术PSQL常用函数汇总 PSQL常用函数汇总正则表达式,PSQL,时间处理,字符串处理PSQL常用函数汇总不定时更新1. 基本函数
    -- 1.1 平均值avg()
    -- 1.2 求和sum()
    --

    礼包 2021年10月27日
  • mysql索引最快的方法(mysql索引优化的几种方法)

    技术如何使MySQL的索引更高效这篇文章主要介绍如何使MySQL的索引更高效,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!MySQL中的索引MySQL中的InnoDB引擎使用B+Tree结构来存储

    攻略 2021年12月20日