JayYip/m3tl

分类问题

ZTurboX opened this issue · 11 comments

请问notebook中,分类的例子中,这里params.init_checkpoint = 'models/cased_L-12_H-768_A-12'是原始bert的模型吗?还有这个项目有模型说明吗或者论文?谢谢

params.init_checkpoint = 'models/cased_L-12_H-768_A-12'是原始bert的模型吗?

是的

这个项目有模型说明吗或者论文?

目前没有, 因为模型比较简单, 类似于微软的MT-DNN

那么这个文本分类,是哪些任务一起做的?哪里体现是multi-task?

在该例子里面并没有其他任务, 是single task

那么用这个代码怎样做mutli-task的文本分类

这个只能在gpu上运行吗?

你可以稍微修改一下执行函数, 但是在cpu上运行会比较慢.

这里应该会要求num_gpu大于0.

但是我用gpu运行总是报这个错
image

你看Registered devices那里没有GPU

可是代码直接用的你的例子的代码

这应该不是这个代码问题, 有可能是你的驱动, 有可能是TF的版本, 有可能是CUDA_VISIBLE_DEVICES 参数的设置