/Twitter-Weibo-DataSet-For-Representaitve-Users

论文中抓取以及标注的代表性人物数据集

Primary LanguageRoff

TwitterUsersProfiling

从大量Twitter用户中找出有代表性的用户

实验步骤

[step1] 1.尝试基于混合属性的聚类方法 2.对聚类方法进行优化,提高效率

[step2] 1.在聚类结果中进行搜索,找出profile子集 2.对搜索过程进行优化,提高效率

[step3] 目前已完成的对比方法有: 1.最朴素的LocalSearch 2.先用k-mediods聚类,然后在质点的最近邻进行搜索添加代表性向量,多次迭代

[step4] 下一步: 完成Affinity Propagation的方法 阅读矩阵求解方法

8-17日更新 [提出的方法] 先贪心算法+回溯法(减枝)

[对比方法] 局部搜索算法(LocalSearch),启发式算法(SA),聚类算法(k-medoids),PageRank

[已完成] 启发式算法,聚类算法,本论文提出方法

[待完成] PageRank,局部搜索算法

2019年1月更新

改进:

  • 1.对Affinity Propagation算法改进,加入了拓扑关系进行聚类。
  • 2.在聚类完之后对有偏差的点进行偏移,因为有些点根据特征被聚到某一个聚类簇中,而其实按照关系属于另一个聚类簇。
  • 3.使用社区发现算法找到社区团。
  • 4.对于稀疏的点未构成社区的点进行DFS搜索形成新的社区来加速后面的采样。
  • 5.采样方法中加入了上界进行剪枝。