/SynthText_Chinese_version

Modify from https://github.com/ankush-me/SynthText.git to generate chinese character

Primary LanguageC++

SynthText中文合成

根据 https://github.com/ankush-me/SynthText.githttps://github.com/JarveeLee/SynthText_Chinese_version

效果示例图

Synthetic Scene-Text Samples Synthetic Scene-Text Samples Synthetic Scene-Text Samples

==需要使用python2.7, 并且依赖满足requirement.txt==

合成

合成图片:

python gen.py --homograph 0.1 --vertical 0.2 --rotated 0.2 --curved 0.1 --contrast 0.8 --opaque 0.8

其中:

  • homograph 调整自然场景嵌入字体的比例
  • vertical 调整竖排字的比例
  • rotated 调整字旋转的比例
  • curved 调整字弧形排列的比例
  • contrast 调整字体颜色对比度的比例
  • opaque 调整字体透明度的比例

(以上实例的值均为默认值)

渲染保存已合成图片

python visualize_results.py
  • 默认输出文件夹为out_images

  • 可更改:字符集标注,字段级标注,是否隐藏数轴

    plot_charBB = True
    plot_wordBB = True
    hide_axis = True

所需材料

  1. 字体文件

    • 需要放入fonts 文件夹,并且在fonts/fontlist.txt 中指定字体的路径

      示例

      fonts
      ├───more_font
          ├───华文隶书.TTF

      则在fonts/fontlist.txt里加入:

      more_font/华文隶书.TTF
      
    • 运行invert_font_size.py 将字体转为font_px2pt.cp,输出到data/models

  2. 语料

    • 放入data/game_texts
  3. 图片

    • 放入data/game_dset/images/results
  4. 图片的depth map

    • 需要使用matlabhttps://bitbucket.org/fayao/dcnf-fcsp/src/master/计算步骤3的图片的depth map

      • 需要配置安装vlfeatmatconvnet
    • 运行prep_scripts/predict_depth.m 计算,输出depth.h5

      • 需要自行更改dir_matConvNet等路径
      • 输出路径为opts.out_h5 = '/path/to/save/output/depth.h5';

      以上所有相关路径在prep_scripts/predict_depth.m

      run( '\code\dcnf-fcsp\libs\vlfeat-0.9.18\toolbox\vl_setup');
      dir_matConvNet='\code\matconvnet-1.0-beta20\matlab\';  
      opts.imdir = '\code\images\2021-05-11';
      opts.out_h5 = '\code\result\depth.h5';
  5. 图片的segmentation map

  6. data/models/colors_new.cpdata/models/char_freq.cp