发现的问题
jingyonglin opened this issue · 0 comments
jingyonglin commented
-
readme中说 那些pretrained 文件放在 base-uncased.
需要在base.py 中改掉 config 里的路径base-chinese -
给的cnews,如果默认 gbk则不能读入,需要 在open(raw_data_path,'r')中加入,encoding='utf-8' 。这个应该是本地默认编码问题,不大
-
运行train步骤,load预训练权重会提示
在 bert_for_multi_class.py", line 11
init_weights() takes 1 positional argument but 2 were given
找了一会,应该是 把self.apply(self.init_weights) 改为 self.apply(self._init_weights)
不过这样也还是没有用到预训练权重bin文件,默认还是用的未训练的权重
把self.apply(self.init_weights) 注释掉,也可以略过加载预训练权重部分,不会报错
暂时发现如上这些