110915-RS slope one

来源:互联网 发布:msp430单片机系统 编辑:程序博客网 时间:2024/05/18 03:21
 

2011年9月15日10:34:11

slope one Predictors for online Rating-Based collaborative filtering

记不清昨天是怎么搜到这paper的了,slope one,又是基于内容的协同过滤算法。没有深入地去研究这个算法,大概看了下slope one的思想,确实是 simple。几点tips:

l  文中提出了一个好的推荐算法应当要满足的5个条件,以往的诸多算法自然是没有完全满足这些条件了。文中提出的Memory-Based Scheme以及Model-Based approach在一定程度上都存在严重缺陷的。

l  对于Model-Based Schemes,文中提及some 是线性代数的产物,SVD、PCA、Eigenvector等;另外一些是借自AI的,如Bayes,Latent Classes、Neural Networking以及clustering等。好一个“借自”AI的Model啊!再一次说明,learning or mining is somehow Mathmatics,linear algebra or statistics,you just cannot skip them。

l  文中也隐含这样一个事实,作者说“文本不是比较各种不同的过滤算法的性能效果,而是证明slope one 算法能够很好地满足我们所说的推荐算法应当满足的5个条件”,确实,各种推荐算法,到底有多少种,不是行家估计都数不清,即便是行家也不敢贸然地就对它们进行比较得出一个谁好谁不好的评估度量标准的了。在learning 和mining里总是存在这么一个事实,应用场景不同,同一个算法的性能就不同了。所以才会有那么多地算法、那么多地改进。因为没有哪一个算法能够通吃的。这是个森林,我所能捕捉到的或许只是一个叶子,不能“一叶障目”啊!

l  所以,总是有这么一个切入点,create new method to satisfy the need,需要很好的功底和研究;还有就是我广泛涉猎,进行泛化,需要付出时间去看去总结,当然也需要某些idea的支撑的。

l  这些是目前缺乏一定的基础,看论文的时候的一些positive thinking,站的高度有些高,没有踏踏实实地去研究算法的机理。希望当自己俯首去推导和研究的时候也能偶尔在这样高出一些来看一些东西。

 

上午在搜集东西的时候搜到一篇博士学位论文,吴金龙的Netflix Prize中的协同过滤算法。谢谢百度空间以及爱问知识人这个平台了,在接下来的时间里会花些时间来研究这篇文章。在吴的博客里也讲述了自己求职的经验,一个北大博士的求职过程,值得学习和思考。希望自己能够按时毕业,也能如愿地进步和改变。

原创粉丝点击