[bj]集体智慧编程
来源:互联网 发布:西安软件测试 编辑:程序博客网 时间:2024/04/30 02:37
第2章 提供推荐
(1)搜集偏好: 数据准备过程,根据用户的不同行为和物品属性确定分值
(2)
user-based collaborative filtering基于用户的协作性过滤
基于用户的推荐:物品x推荐给用户y的推荐值=sum(用户y1与y相似度*y1对x的评分)for each y1;
item-based collaborative filtering基于物品的协作性过滤
基于物品的推荐:物品x推荐给用户y的推荐值=sum(物品x1与x相似度*y对x的评分)for each x1;
(3)选择user-based还是item-based取决于目的,若用户的数据量较大且变化频繁时,则用户相似度计算耗费时间较多且次数也频繁;
物品相对于用户数据则稳定的多,物品相似度更新不用太频繁。
(4)皮尔逊相关度
相对于欧式距离的区别详见http://blog.csdn.net/hu17889/archive/2011/06/11/6538007.aspx
第3章 发现群组
(1)问题博客分组;样本:博客,特征:关键词数量,方法:分层聚类,kmeans聚类。
距离定义:皮尔逊相关度,因为不同博客下,具有相似单词量分布,但单词数量可能不同。如[1 2 3]与[11 12 13]的相关度为0
皮尔逊相关度的说明详见http://blog.csdn.net/hu17889/archive/2011/06/11/6538007.aspx
(2)用tanimoto系数度量二值数据矢量直接的距离,应用:用户-物品(喜欢1,不喜欢0)
(3)对于用非欧氏距离求得的距离矩阵只包含两两关系,并且不一定符合欧式空间分布,文中提出了一种将上述距离矩阵转化为欧式二维分布并形式化表达出来,高维数据也能通过求两两距离转化为距离矩阵,再用本文方法画出二维样本分布图,方便观察数据。
- [bj]集体智慧编程
- 集体编程智慧(1)
- 集体编程智慧(2)
- 集体智慧编程 简介
- 集体智慧编程
- 集体智慧编程 简介
- 集体智慧编程movielens
- 集体智慧编程
- 《集体智慧编程》数学公式
- 集体智慧编程_前言
- 集体智慧编程_聚类
- 集体智慧编程 读书笔记 一
- 集体智慧编程 读书笔记 二
- 集体智慧编程 读书笔记 三
- 集体智慧编程-单词统计
- 集体智慧编程的笔记
- 集体智慧编程--推荐系统
- 《集体智慧编程》chapter1 recommendation2
- 在c#中如何动态改变iframe的src值,动态指向一个网页
- 在文章中添加:原文出处
- NT下如何彻底删除Oracle?
- DOS 运行命令
- Android调用系统的发邮件方法
- [bj]集体智慧编程
- FreeMarker基本用法
- SPringMVC注解驱动
- Oracle session active 和 inactive 状态 说明
- 认知维度与API的可用性评估 [原文转自“百度泛用户体验”]
- 旋转卡壳卡了我两天!!!
- tangram开发中使用的开源工具介绍 [转自“百度泛用户体验”]
- 一些关于SQL SERVER 2008的问题
- 谈一谈网络编程学习经验(06-08更新)