文本聚类

来源:互联网 发布:js引用本地json文件 编辑:程序博客网 时间:2024/06/08 12:19

Python爬虫:
http://python.jobbole.com/81332/
http://python.jobbole.com/81359/

python读取excel文件:
http://www.cnblogs.com/shaosks/p/6098282.html

使用scikit-learn进行KMeans文本聚类:https://blog.yueyu.io/p/1614(这个完整的实现了)
http://blog.csdn.net/sinat_26917383/article/details/70240628

kmeans:http://blog.csdn.net/zouxy09/article/details/17589329

完整的中文文本聚类:http://blog.csdn.net/songzhilian22/article/details/49636725

结果我的数据聚类效果不好

==============2017.9.26==============
层次聚类
http://blog.csdn.net/jwh_bupt/article/details/7685809
http://blog.csdn.net/waleking/article/details/7801764
https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.fclusterdata.html

http://blog.csdn.net/elaine_bao/article/details/50242867