RecSys2013: Yelp Business Rating Prediction参赛纪录

来源:互联网 发布:mysql备份指定数据库 编辑:程序博客网 时间:2024/06/11 05:36

1.

时间:Sun, 26 May 2013 08:33:17

方法:基本的biasSVD(项亮老师推荐系统实践P198)

RMSE:1.31941

排名:60

思路:冷启动


2. 

时间:Tue, 28 May 2013 08:07:20

方法:BiasSVD,冷启动问题采用基本的平均值,对于只有user_id的用该user的平均评分,只有business_id的用该business的平均评分,对于二者都没有的用全局平均分

RMSE:1.24920

排名:21

思路:目前只用到了business、user、review三元组,其他信息没有利用。找到其他信息的用法。


3.

时间:Tue, 28 May 2013 12:46:03

方法:利用了评分总数、评分均值

RMSE:1.24322

排名:9

思路:此乃下策,应当不用。

4.

思路:

1)如果一个商店的评分平均分为5,所有评分均为5

2)连锁店的话是不是评分会类似?需做试验验证

时间:2013.5.30

记录:今日比较悲剧,一共两次提交机会,第一次提交了一个错的版本,第二次也没提高成绩。应该是因为SVD的时候随机初始化P和Q导致的,结果会不稳定,小范围波动。

下午处理性别和喜好类别,看看性别是否和评分有关。Excel、matlab、notepad++齐上手啊。。。