youthpasses/bayes_classifier

程序好像有问题,在bayesclassifier.py文件漏了一个.split(',')

thouger opened this issue · 1 comments

bayesclassifier.py文件的20行allwords_fre_allwords_num = training_word_p_list[0].strip(),是不是应该为allwords_fre_allwords_num = training_word_p_list[0].strip().split(',')?

而且里面有些地方我不太清楚是什么意思,比如

  1. float(fre_ + 1) / (index_word_pre + word_num_allClass)这里,难道这是计算tf-idf?但是tf-idf的公式好像不是这样的吧。
  2. 这里最要是利用贝叶斯分类,但我看了2小时终于看到最后,发现在getPofClass函数里面用了一个math.log(float(p), 2)计算p值,难道p值不是用P(B|A) = (P(A|B)P(B))/(P(A))这个公式吗?math.log是计算什么的呢?
  3. 我发现在bayesclassifier.pynativeTest里面似乎是有计算贝叶斯的,但被注释掉,而且在99行dir_path = os.path.join(os.path.dirname())似乎漏了一个参数