用户对齐算法整合

文件结构

  • algs/         算法的具体实现

  • data/         用于存放数据文件

  • metrics/     算法评价方法的具体实现

  • model/     用于存放保存的模型文件

  • results/     可以用于保存输出的结果

  • utils/         工具方法的具体实现

  • run.py       模型训练及测试的脚本

运行方法

  • 执行 python run.py [算法] 即可自动执行整个流程,包括数据预处理,模型训练,测试评价。

    示例:运行MNA算法: 
    python run.py mna

  • 各种参数的调整可以通过在算法名称之后添加 -参数名 参数 来完成

    示例:运行MNA算法,并指定模型存放路径为 model/MNA.pkl : 
    python run.py mna -model_path model/MNA.pkl

  • 评价模型的性能采用:

    • 分类任务指标
      • F1
      • Accuracy
      • AUC
    • 排序任务指标
      • MRR
      • Precision@1
      • Precision@5

进展情况

目前实现算法包括:

  • MNA算法   python run.py -mna
  • STUL算法   python run.py -stul
  • HYDRA算法   python run.py -hydra

其他说明

  1. 目前的实现暂未使用网络结构特征,后续会进行补充

参考文献

1.MNA: Kong, Xiangnan, Jiawei Zhang, and Philip S. Yu. "Inferring anchor links across multiple heterogeneous social networks." Proceedings of the 22nd ACM international conference on Information & Knowledge Management. 2013.
2.STUL: Chen, Wei, et al. "Exploiting spatio-temporal user behaviors for user linkage." Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. 2017.
3.HYDRA: Liu, Siyuan, et al. "Hydra: Large-scale social identity linkage via heterogeneous behavior modeling." Proceedings of the 2014 ACM SIGMOD international conference on Management of data. 2014.