本程序为大三下数据挖掘课程设计。 1.简介 输入为twitter用户和关注对象, 数据结构如下: struct node { int id; .....; }; struct edge { int source; int target; }; 输出为用户关联度:如用户关注A,则该用户同时关注B的概率(A->B) 2.方法 采用FP—growth算法,构造一个FP树,然后遍历得到关系集 关系集为文件形式输出,文件名为FP_set 3.问题 1.支持度统计严重过大。应该是在t_list计数的时候重复或者s_list删除节点的时候有失误 2.FP树虽然生成了,但是没有按照预期顺序遍历s_list,貌似生成算法不完善 3.计算支持度的时候不能正确查找右兄弟节点,某些节点如1125号甚至不能正确查找左孩子节点。 因为要急着交报告,因此就没再改。BUG以后有缘再改吧。 电子科大计算机--2012级陈帅