/dblp_parse

parse the dblp.xml using python xml.sax and calculate statistical information

Primary LanguagePython

使用python解析dblp.xml

  • 可选择抽取一些指定期刊或者会议的记录信息
  • 抽取网络结构(合作者关系)
  • 统计相关节点和边信息

注意事项

  • 将dblp.xml以及dtd文件放在根目录下
  • 将dblp文件中的'&'符号用';'替换掉,防止解析时内容提取错误(某些26个英文单词外的特殊字符是用一些变量显示的,可参看dtd文件)