发现的问题

Question

jingyonglin opened this issue 4 years ago · 0 comments

readme中说那些pretrained 文件放在 base-uncased.
需要在base.py 中改掉 config 里的路径base-chinese
给的cnews，如果默认 gbk则不能读入，需要在open(raw_data_path,'r')中加入,encoding='utf-8' 。这个应该是本地默认编码问题，不大
运行train步骤，load预训练权重会提示
在 bert_for_multi_class.py", line 11
init_weights() takes 1 positional argument but 2 were given
找了一会，应该是把self.apply(self.init_weights) 改为 self.apply(self._init_weights)
不过这样也还是没有用到预训练权重bin文件，默认还是用的未训练的权重
把self.apply(self.init_weights) 注释掉，也可以略过加载预训练权重部分，不会报错

暂时发现如上这些