基于KNN算法的用户兴趣主题的发现

来源:互联网 发布:剑三喵萝捏脸数据下载 编辑:程序博客网 时间:2024/05/22 15:57

根据用户访问的网页,得到用户喜爱的模型如下的步骤:

1、将用户访问的网页,分词处理,去停用词

2、VSM向量空间模型的创建,VSM单词数满足训练集的单词数。

3、使用KNN算法,选择使用余弦距离,计算待分类样本与每一个样本的余弦值。选取最小的K个文本,同时知道它们的类别。




0 0
原创粉丝点击