数据比赛 Pandas 相关用法
来源:互联网 发布:java马士兵整套视频 编辑:程序博客网 时间:2024/06/18 05:26
1、one_hot 编码
df_train = pd.get_dummies(df_train)
2、删除某一列值为空的行
df = df.dropna(subset=['transactionid'])
3、统计df
# 统计地方为空
df.isnull().sum()
#统计df各列的count
df.counts()
4、映射值
order_df['price_real'] = np.round(5**order_df['price']-1, 2)
order_df['price_real'] = order_df['price_real'].apply(lambda x: log((1 + x),5))
5、删除列及重命名
fields_to_drop = ['loan_amount','loan_sum']
loan_df = loan_df.drop( fields_to_drop, axis = 1 )
loan_df = loan_df.rename(columns={'loan_amount_1': 'loan_amount'})
6、设置条件并赋值
# 设置筛选条件:选择 sex 为 male
mask = (data['sex']=='male')
# .loc[] 赋值
data.loc[mask, 'id'] = 100
7、按某条件对某一列的值进行替换
train_df['price'].ix[train_df['price']>ulimit] = ulimit
8、根据条件选取df中的数据
sub1=data.loc [(data['列A‘]=='筛选的数值’)& data['列B‘].str.contains('筛选的关键字’),['C','D']]
9、对df根据某一列条件筛选后的df,再按条件排序
df_loan[df_loan['uid'] == 2360].sort_values(by='loan_time')
- 数据比赛 Pandas 相关用法
- 数据分析pandas用法
- 大数据和人工智能的相关比赛
- pandas用法
- pandas做数据分析(五):统计相关函数
- pandas的基本用法(二)——选择数据
- Pandas的基本用法(三)——设置数据
- pandas的基本用法(四)——处理缺失数据
- pandas的基本用法(五)——导入导出数据
- pandas的基本用法(六)——合并数据
- pandas的基本用法(七)——合并数据merge
- pandas的基本用法(八)——数据的绘制
- python之pandas用法(用于矩阵等数据的操作)
- pandas小记:pandas数据输入输出
- 相关比赛题目总结
- python数据分析复盘——数据分析相关库之Pandas
- Python数据分析模块 | pandas做数据分析(三):统计相关函数
- python pandas 用法
- Eclipse
- aptx-ble
- COW(copy on write), SSO (small string optimization)浅析
- 了解c#中的三层架构(DAL,BLL,UI)
- 为什么你会Excel快捷键可还是比别人效率低?
- 数据比赛 Pandas 相关用法
- C#个人重构之注册、退卡
- Spring实战——面向切面的Spring
- 参考java初级工程师面试题添加了一点知识点和链接
- IA-32 Intel手册学习笔记(二)保护模式下的内存管理
- MySQL insert into select
- MATLAB 之 图像小波变换函数
- win7安装node,win7卸载node,win7安装npm ,淘宝镜像,win7webpack打包错误解决
- java IText 导出word表格