/text_clustering

文本聚类(Kmeans、DBSCAN、LDA、Single-pass)

Primary LanguagePythonApache License 2.0Apache-2.0

text_clustering

文本聚类

目录

  • data

    • 存放数据
  • Kmeans

    • 基于KMeans的无监督中文文本聚类
  • DBSCAN

    • 基于DBSCAN的无监督中文文本聚类
  • LatentDirichletAllocation

    • 基于LDA的无监督文本聚类
  • Single_Pass

    • 基于single pass 策略进行聚类,不需要事先设置类别数