/tag_doc_with_lda

tag doc using topN words with lda

Primary LanguagePython

tag doc using topN words with lda

利用LDA的历史训练,为新文章自动打Tag的thrift服务。

该方法通过infer得到文档的theta分布,找到该文档概率最大主题编号,然后根据phi分布获取主题编号的topN词,作为文章标签输出。

collapsed Gibbs LDA reference : my blog