item-cf改进
来源:互联网 发布:专业网络公关 编辑:程序博客网 时间:2024/06/06 12:54
接之前的item-cf算法,又了解了一下numpy,pandas等内容后,有了更简单方便的求item-cf的思路,但是有个问题,由于数据量的关系,速度非常慢,下面这个方法虽然代码很简单,但在实际运行过程中非常慢。。。。
代码如下
from pandas import Series,DataFrameimport pandas as pdimport numpy as npimport pymysqlimport codecsdb=pymysql.connect("localhost","root","","douban")cursor=db.cursor()sql="select distinct bookID,uri,rating from comments;"cursor.execute(sql)data=cursor.fetchall()db.close()frame=DataFrame()for item in data: frame.loc[item[1],item[0]]=item[2]print(item)print('all data in')__=frame.fillna(0,inplace=True)corr=frame.corr()print('finished counting')corr.to_csv('testDemo.csv')print('finished saving')主要变化是依靠DataFrame动态扩张的特性,直接从数据库读取数据写入frame
然后使用DataFrame的corr()函数直接求相关系数。
就是这样,最后输出testDemo.csv就是一个各书籍间的相关系数列表。
但是由于非常慢,所以目前还未得到结果。
阅读全文
0 0
- item-cf改进
- item-CF item-KNN的区别
- Item CF 和 User CF的适用场景和区别
- item-based CF 推荐系统学习笔记
- 使用numpy完成item-cf算法
- 目标跟踪之相关滤波:CF及后续改进篇
- mahout 0.6基于Item的CF代码分析
- 基于物品的协同过滤算法(Item-CF)
- soledede--个性化推荐引擎-Solr实现协同过滤(Item-CF)
- 协同过滤user-based CF算法与item-based CF算法对比
- <五>、简单分析基于物品的 CF(Item CF)推荐算法
- CF
- CF
- cf
- cf
- CF
- CF
- CF
- 如何定义一个只能在栈上生成对象的类
- 防止过拟合的处理方法
- JS特性--闭包
- windows主机如何登录阿里云服务器
- LG1028 数的求解(记录)
- item-cf改进
- Java中的单例模式
- 神奇的bug之逗比解决法
- C、C++一次将整个文件读入内存
- uva12108
- 数据结构之--优先级队列(Java代码)
- 浅谈KVC
- 51nod 1627 区间交
- 重写scrapy中间件之RetryMiddleware