做NLP关键词提取时自己实现了一下TF-IDF算法
Primary LanguageJupyter Notebook
该算法由于公式原因,当所有样本里都含有该关键词时,IDF就为负数。但不知为何这个很严重的bug并没有找到相关提出。