来自数据库的大数据预处理Python机器学习篇(一)
来源:互联网 发布:电脑服务网络怎么办 编辑:程序博客网 时间:2024/06/17 03:01
1)利用pandas构建dataframe
dict_data = {'评论日期': jd_rq, '评论时间': jd_sj, '评论信息': jd_xx, '购买信息': jd_gxx, '评论星级': jd_xj, '用户等级': jd_dj, '用户名字': jd_mz}table1 = pd.DataFrame(dict_data)
2)利用describe()查看特征统计情况
train=table1# print(train.head(3))print(train.describe())# print(train.columns)# print(train.values[0])
3)将str类型转换为机器学习算法可以处理的int或float类型
'''处理用户等级'''print(train['用户等级'].unique())#获取用户等级类别个数train.loc[train['用户等级']=='铜牌会员','用户等级']=0train.loc[train['用户等级']=='银牌会员','用户等级']=1train.loc[train['用户等级']=='金牌会员','用户等级']=2train.loc[train['用户等级']=='钻石会员','用户等级']=3train.loc[train['用户等级']=='PLUS会员[试用]','用户等级']=4train.loc[train['用户等级']=='PLUS会员','用户等级']=5接着用print打印一下train['用户等级']
好了,今天折磨一下午的预处理算是OK。
之前把dataframe写到CSV,再用pandas去读..绕一圈还发生keyerror
阅读全文
0 0
- 来自数据库的大数据预处理Python机器学习篇(一)
- Python下的机器学习工具scikit-learn --数据预处理
- Python下的机器学习工具scikit-learn(学习笔记3--数据预处理)
- 机器学习数据预处理
- 【机器学习】数据预处理
- 机器学习-常见的数据预处理
- 机器学习(一):用sklearn进行数据预处理:缺失值处理、数据标准化、归一化
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- 机器学习实战--数据预处理
- 机器学习-->sklearn数据预处理
- spark机器学习(Chapter 03)--使用spark-python进行数据预处理和特征提取
- 机器学习笔记——Scikit-learn库中的数据预处理(一)
- 机器学习之旅:数据预处理的对象-数据
- 基于python的机器学习(一)
- Python机器学习探索(一)——计算机学习数据的能力
- Spark学习(一)基础数据预处理
- 程序员编程生涯中会犯的7个错误
- [Linux] OpenSSH 升级
- websocket @ServerEndpoint注解形式开发 @OnOpen 如何获取httpSession
- java是否为空的判断的例子
- 08.js.while循环
- 来自数据库的大数据预处理Python机器学习篇(一)
- 使用 delve 调试 golang 程序
- Package.com.google.gson API 详细 学习(2)
- Linux 实用命令
- 新路程------linux内核和busybox配置ulimit使能core dump
- Stealing Harry Potter's Precious HDU
- 09.js.break,continue语句
- javascript
- TP5+SPL----FilesystemIterator(迭代器)