在你的博客机器学习实战中有一处问题
jccjd opened this issue · 1 comments
jccjd commented
在你的博客:机器学习实战教程(五):朴素贝叶斯实战篇之新浪新闻分类中(https://cuijiahua.com/blog/2017/11/ml_5_bayes_2.html)
在对字符串转换成字符列表中用了listOfTokens = re.split(r'\W*, bigString)
, 应该是listOfTokens = re.split(r'\W+', bigString)
最后造成分类的错误率达60%, 我看你github
里的源码,是没有问题的,应该是笔者的手误
Jack-Cherish commented
@jccjd 已修改,感谢。