快速风格迁移实践

可用资源下载

训练模型为slim预训练资源
vgg16预训练模型

本次实验仅仅是用来训练数据(不含标签),后面的5个链接是为了数据完整性给出的,针对本次实验不需下载
COCO2017训练数据
COCO2017训练标签
COCO2017验证数据
COCO2017验证标签
COCO2017测试数据
COCO2017测试标签

项目文件介绍

net:放置官方使用slim模块实现的网络模型
train2017:下面存放图片数据,即COCO训练用数据(无标签)
general_net.py:用于生成风格迁移图片的网络
losses.py:损失函数集合,包含风格损失计算,内容损失计算,以及平滑损失计算
main.py:主文件,整合了整个网络图景,并含有训练过程的逻辑
style_image_gen.py:使用训练好的模型,将自己的图片加载上进行风格迁移
utils.py:辅助函数,包含图片预处理、gram矩阵计算以及风格图片gram矩阵获得等函数

脚本运行指南

训练和迁移自己的图片都很简单,训练时如下即可:

python main.py

然后新建终端,输入,

tensorboard --logdir=./logs

就可以在浏览器上输出相关监测值了,包含各个loss值以及中间输出图片。
训练结束后,或者只要有模型生成就可以,打开编辑脚本style_image_gen.py,找到如下一行(20行左右),将图片修改成需要迁移的图片路径,

text_img = './000000000036.jpg'

保存后命令行输入:

python style_image_gen.py

即可输出对自己模型的迁移结果。

迁移风格展示

这里展示一张训练中得到的监测图

项目网络结构

更新日志

18.5.7

1、改正main.py中"tf.local_variables"为"tf.global_variables"

之前测试时修改过去忘记改回来了,这导致局部变量epoch被保存,导致之后的训练如果继承了前面训练过得模型会继承epoch信息报告到达预定轮数直接退出,另由于没有载入模型参数(均为global_variables)会导致训练不收敛

2、改正main.py中两处"vgg16"为"vgg_16"

这个疏忽导致"variables_to_train"和"variables_to_restore"收集变量异常,进而导致网络不收敛

3、改进训练循环中的保存图片机制

由原来如下的常规图像处理,修改为summary记录机制。

if not os.path.exists('./保存图像'):
    os.makedirs('./保存图像')
    img_raw = sess.run(image_batch)[0]
    img_gen = sess.run(generated)[0]
    try:
        img_raw = Image.fromarray(np.uint8(img_raw))
        img_raw.save('./保存图像/{}_.png'.format(step))
        img_gen = Image.fromarray(np.uint8(img_gen))
        img_gen.save('./保存图像/{}.png'.format(step))
    except BaseException as e:
        tf.logging.info(e)

由于sess一次原始数据,在使用队列维护数据机制下,就会消耗一个batch的数据,频繁记录输出图片会导致参与训练的数据减少严重,所以在小数据测试时我发现实际训练step少于理论上计算值,就是因为很多batch的数据没有被训练被用于生成图像了,如果将输出图像和train_op集成后一起run也可以解决,不过增加了很多冗余输出,毕竟不是每个step都要可视化的。

_, loss_t, step, img_raw, img_gen = sess.run([train_op, loss, global_step, image_batch, generated])

18.5.10

添加文件style_image_gen.py

这个程序可以加载已训练好的模型文件,将自己的图片轻松的进行风格迁移。