lixin4ever/BERT-E2E-ABSA

数据集问题

WUJUNF opened this issue · 1 comments

你好,我想请教一下你,就是论文里用到的例子是用BIOES,即The=O AMD=B-POS Turin=I-POS Processor=E-POS seems=O to=O perform=O better=O than=O Intel=S-NEG ;然后看到数据集里用到的数据集The=O Mountain=T-POS Lion=T-POS OS=T-POS is=O not=O hard=O to=O figure=O out=O if=O you=O are=O familiar=O with=O Microsoft=T-NEU Windows=T-NEU .=O 都是以T开头?不应该也是BIOES格式吗?

读取数据的时候我们的代码会把label sequence从OT编码转换到指定的标签编码(tagging scheme)