Sniper

写在前面

由于苏神开发的bert4keras并没有什么文档,苏神本人的文档写了个头就没动过了,取而代之的是很多例子。

这对框架的使用者造成了一定的困扰,事实上我在初识bert4keras时,因为没文档,一度选择了学习transformers,当然transformers是一个很好的框架,但是对于学习的人来说,并没有bert4keras来的实在,毕竟有苏神在带着。

本文主要为我在阅读和使用bert4keras源码时的思考,和使用方法一并写下(试图)作为一版文档吧。

因此,其实本仓库并不能称作完整的文档,其实是一个笔记,争取把用法和代码讲明白(我也能力有限,只能把我用过的和我学过的部分进行说明)。

已经做了transformers的contributor努力做bert4keras的哈哈哈哈。

本文可能会照搬很多苏神的文字和代码,如果苏神介意我就取消开源

快速开始

下面是一个调用bert base模型来编码句子的简单例子:

from bert4keras.models import build_transformer_model
from bert4keras.tokenizers import Tokenizer
import numpy as np

config_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_config.json'
checkpoint_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_model.ckpt'
dict_path = '/root/kg/bert/chinese_L-12_H-768_A-12/vocab.txt'

tokenizer = Tokenizer(dict_path, do_lower_case=True)  # 建立分词器
model = build_transformer_model(config_path, checkpoint_path)  # 建立模型,加载权重

# 编码测试
token_ids, segment_ids = tokenizer.encode(u'语言模型')

print('\n ===== predicting =====\n')
print(model.predict([np.array([token_ids]), np.array([segment_ids])]))

其他库

其他库详见文件列表。分别对应了bert4keras的几大文件。