carrot 2 LingoClusteringAlgorithm , STCClusteringAlgorithm 和 BisectingKMeansClusteringAlgorithm算法比较

来源:互联网 发布:闲鱼钓鱼源码 编辑:程序博客网 时间:2024/05/18 06:24
  • org.carrot2.clustering.lingo.LingoClusteringAlgorithm

    适用于 结果聚类,文档数量 <1000,如果文档数量很大的话,花费时间较长

    可以形成,比较长的形式比较好的标签

    org.carrot2.clustering.stc.STCClusteringAlgorithm

            形成的标签比较短

    性能比较好,适用于 大数据量,比如整个索引的聚类

    org.carrot2.clustering.kmeans.BisectingKMeansClusteringAlgorithm

            适用于小数据量的聚类 <1000

            对于一个聚类可以形成多个标签,来描述。



原创粉丝点击