快速风格迁移实践

可用资源下载

训练模型为slim预训练资源
vgg16预训练模型

本次实验仅仅是用来训练数据(不含标签)，后面的5个链接是为了数据完整性给出的，针对本次实验不需下载
COCO2017训练数据
 COCO2017训练标签
 COCO2017验证数据
 COCO2017验证标签
 COCO2017测试数据
 COCO2017测试标签

项目文件介绍

net:放置官方使用slim模块实现的网络模型
train2017:下面存放图片数据，即COCO训练用数据（无标签）
general_net.py:用于生成风格迁移图片的网络
losses.py:损失函数集合，包含风格损失计算，内容损失计算，以及平滑损失计算
main.py:主文件，整合了整个网络图景，并含有训练过程的逻辑
style_image_gen.py:使用训练好的模型，将自己的图片加载上进行风格迁移
utils.py:辅助函数，包含图片预处理、gram矩阵计算以及风格图片gram矩阵获得等函数

脚本运行指南

训练和迁移自己的图片都很简单，训练时如下即可：

python main.py

然后新建终端，输入，

tensorboard --logdir=./logs

就可以在浏览器上输出相关监测值了，包含各个loss值以及中间输出图片。
训练结束后，或者只要有模型生成就可以，打开编辑脚本style_image_gen.py，找到如下一行（20行左右），将图片修改成需要迁移的图片路径，

text_img = './000000000036.jpg'

保存后命令行输入：

python style_image_gen.py

即可输出对自己模型的迁移结果。

迁移风格展示

这里展示一张训练中得到的监测图

项目网络结构

更新日志

18.5.7

1、改正`main.py`中"tf.local_variables"为"tf.global_variables"

之前测试时修改过去忘记改回来了，这导致局部变量epoch被保存，导致之后的训练如果继承了前面训练过得模型会继承epoch信息报告到达预定轮数直接退出，另由于没有载入模型参数(均为global_variables)会导致训练不收敛

2、改正`main.py`中两处"vgg16"为"vgg_16"

这个疏忽导致"variables_to_train"和"variables_to_restore"收集变量异常，进而导致网络不收敛

3、改进训练循环中的保存图片机制

由原来如下的常规图像处理，修改为summary记录机制。

if not os.path.exists('./保存图像'):
    os.makedirs('./保存图像')
    img_raw = sess.run(image_batch)[0]
    img_gen = sess.run(generated)[0]
    try:
        img_raw = Image.fromarray(np.uint8(img_raw))
        img_raw.save('./保存图像/{}_.png'.format(step))
        img_gen = Image.fromarray(np.uint8(img_gen))
        img_gen.save('./保存图像/{}.png'.format(step))
    except BaseException as e:
        tf.logging.info(e)

由于sess一次原始数据，在使用队列维护数据机制下，就会消耗一个batch的数据，频繁记录输出图片会导致参与训练的数据减少严重，所以在小数据测试时我发现实际训练step少于理论上计算值，就是因为很多batch的数据没有被训练被用于生成图像了，如果将输出图像和train_op集成后一起run也可以解决，不过增加了很多冗余输出，毕竟不是每个step都要可视化的。

_, loss_t, step, img_raw, img_gen = sess.run([train_op, loss, global_step, image_batch, generated])

18.5.10

添加文件`style_image_gen.py`

这个程序可以加载已训练好的模型文件，将自己的图片轻松的进行风格迁移。