guxd/deep-code-search

Questions about the dataset.

Closed this issue · 3 comments

您好,我运行了pytorch版本的train.py,但是出现了以下错误,在/data/github/目录下并没有valid.apiseq.h5等文件,请问是哪里出了问题?怎么解决呢?
OSError: ./data/github/valid.apiseq.h5 does not exist

guxd commented

data/github/目录下是简单样例数据,你需要从google drive上下载真实数据集。见README。

您好,数据集里只用train部分的rawcode.txt
可以将test部分的rawcode.txt分享一下吗?

guxd commented

你好,我们提供的只有use.rawcode.txt
test用真实的SO问题人工打分的。