SynthText中文合成

根据 https://github.com/ankush-me/SynthText.git 和 https://github.com/JarveeLee/SynthText_Chinese_version

效果示例图

==需要使用python2.7, 并且依赖满足requirement.txt==

合成

合成图片:

python gen.py --homograph 0.1 --vertical 0.2 --rotated 0.2 --curved 0.1 --contrast 0.8 --opaque 0.8

其中：

homograph 调整自然场景嵌入字体的比例
vertical 调整竖排字的比例
rotated 调整字旋转的比例
curved 调整字弧形排列的比例
contrast 调整字体颜色对比度的比例
opaque 调整字体透明度的比例

(以上实例的值均为默认值)

渲染并保存已合成图片

python visualize_results.py

默认输出文件夹为out_images
可更改：字符集标注，字段级标注，是否隐藏数轴
```
plot_charBB = True
plot_wordBB = True
hide_axis = True
```

所需材料

字体文件
- 需要放入fonts 文件夹，并且在fonts/fontlist.txt 中指定字体的路径
  
  示例：
```
fonts
├───more_font
    ├───华文隶书.TTF
```
  则在fonts/fontlist.txt里加入：
```
more_font/华文隶书.TTF
```
- 运行invert_font_size.py 将字体转为font_px2pt.cp，输出到data/models
语料
- 放入data/game_texts
图片
- 放入data/game_dset/images/results
图片的depth map
- 需要使用matlab和https://bitbucket.org/fayao/dcnf-fcsp/src/master/计算步骤3的图片的depth map
  - 需要配置安装vlfeat和matconvnet
- 运行prep_scripts/predict_depth.m 计算，输出depth.h5
  - 需要自行更改dir_matConvNet等路径
  - 输出路径为opts.out_h5 = '/path/to/save/output/depth.h5';
  以上所有相关路径在prep_scripts/predict_depth.m为
```
run( '\code\dcnf-fcsp\libs\vlfeat-0.9.18\toolbox\vl_setup');
dir_matConvNet='\code\matconvnet-1.0-beta20\matlab\';  
opts.imdir = '\code\images\2021-05-11';
opts.out_h5 = '\code\result\depth.h5';
```
图片的segmentation map
- 对步骤3的图片运行prep_scripts/run_ucm.m，输出 ucm.mat
  - 需要下载VOC2012数据集https://deepai.org/dataset/pascal-voc和安装https://github.com/jponttuset/mcg
  - 安装成功后更改prep_scripts/run_ucm.m中以下路径
```
img_dir = '../../depth_seg_images/2021-05-11';
mcg_dir = '/code/tmp/mcg/pre-trained';
```
- 运行prep_scrips/floodFill.py，使用ucm.mat输出seg.h5
data/models/colors_new.cp和data/models/char_freq.cp
- 可以从http://www.robots.ox.ac.uk/~ankush/data.tar.gz下载并且放入`data/models`文件夹

jasonyux/SynthText_Chinese_version

SynthText中文合成

合成

所需材料