Jack-Cherish/Machine-Learning

在你的博客机器学习实战中有一处问题

jccjd opened this issue · 1 comments

jccjd commented

2019-08-31 11-35-45屏幕截图
在你的博客:机器学习实战教程(五):朴素贝叶斯实战篇之新浪新闻分类中(https://cuijiahua.com/blog/2017/11/ml_5_bayes_2.html)
在对字符串转换成字符列表中用了listOfTokens = re.split(r'\W*, bigString), 应该是listOfTokens = re.split(r'\W+', bigString)

最后造成分类的错误率达60%, 我看你github里的源码,是没有问题的,应该是笔者的手误

@jccjd 已修改,感谢。