使用链接:https://github.com/attardi/wikiextractor
链接:https://pan.baidu.com/s/13C2s4eencWdUH6MmLIbfiw
提取码:aqkg
使用方式:
THUCNewsExtractor.py
[input dir] direcotory of unzip files
[-o] [output dir] extract directory
使用链接:https://github.com/attardi/wikiextractor
链接:https://pan.baidu.com/s/13C2s4eencWdUH6MmLIbfiw
提取码:aqkg
使用方式:
THUCNewsExtractor.py
[input dir] direcotory of unzip files
[-o] [output dir] extract directory