程序好像有问题,在bayesclassifier.py文件漏了一个.split(',')
thouger opened this issue · 1 comments
thouger commented
bayesclassifier.py文件的20行allwords_fre_allwords_num = training_word_p_list[0].strip(),是不是应该为allwords_fre_allwords_num = training_word_p_list[0].strip().split(',')?
thouger commented
而且里面有些地方我不太清楚是什么意思,比如
float(fre_ + 1) / (index_word_pre + word_num_allClass)
这里,难道这是计算tf-idf?但是tf-idf的公式好像不是这样的吧。- 这里最要是利用贝叶斯分类,但我看了2小时终于看到最后,发现在
getPofClass
函数里面用了一个math.log(float(p), 2)
计算p值,难道p值不是用P(B|A) = (P(A|B)P(B))/(P(A))
这个公式吗?math.log是计算什么的呢? - 我发现在
bayesclassifier.py
的nativeTest
里面似乎是有计算贝叶斯的,但被注释掉,而且在99行dir_path = os.path.join(os.path.dirname())
似乎漏了一个参数