从大量Twitter用户中找出有代表性的用户
[step1] 1.尝试基于混合属性的聚类方法 2.对聚类方法进行优化,提高效率
[step2] 1.在聚类结果中进行搜索,找出profile子集 2.对搜索过程进行优化,提高效率
[step3] 目前已完成的对比方法有: 1.最朴素的LocalSearch 2.先用k-mediods聚类,然后在质点的最近邻进行搜索添加代表性向量,多次迭代
[step4] 下一步: 完成Affinity Propagation的方法 阅读矩阵求解方法
8-17日更新 [提出的方法] 先贪心算法+回溯法(减枝)
[对比方法] 局部搜索算法(LocalSearch),启发式算法(SA),聚类算法(k-medoids),PageRank
[已完成] 启发式算法,聚类算法,本论文提出方法
[待完成] PageRank,局部搜索算法
2019年1月更新
改进:
- 1.对Affinity Propagation算法改进,加入了拓扑关系进行聚类。
- 2.在聚类完之后对有偏差的点进行偏移,因为有些点根据特征被聚到某一个聚类簇中,而其实按照关系属于另一个聚类簇。
- 3.使用社区发现算法找到社区团。
- 4.对于稀疏的点未构成社区的点进行DFS搜索形成新的社区来加速后面的采样。
- 5.采样方法中加入了上界进行剪枝。