yizt/crnn.pytorch

遇到一个问题,就是用 fontutils.py中对我的字体做并集

daixiangzi opened this issue · 3 comments

然后得到一个类似于你的word.txt,但是在做 idx = [chars[c] for c in text]取类别的时候发现,对于数字出现Key error,后来我查了下,我保存下来的word.txt中的数字都是windows-1252编码,而我的系统都是UTF-8编码,所以会出现这种情况,请问你遇到过这种情况么

下面是我的测试代码。
import os
import sys
import chardet
import codecs
f = codecs.open(sys.argv[1], mode='r', encoding='utf-8')
lines = f.readlines()
f.close()
words = [l.strip() for l in lines]

dicts = {}
for i, char in enumerate(words):
print(char)
dicts[char] = i
print(dicts['4'])

yizt commented