【数据平台】python数据集连接和组合
来源:互联网 发布:易幻网络校园招聘 编辑:程序博客网 时间:2024/05/10 23:44
场景:dataframe之间的链接,以及list之间的组合。
参考:
# -*- coding: utf-8 -*-'''Created on 2017年9月30日@author: Administrator'''import pandas as pdimport itertoolsfrom itertools import product#mergedf1=pd.DataFrame({'name':['z','q','s','l'],'subid':['1','2','',''],'cid':['c1','','c2','c3']})print (df1)df2=pd.DataFrame({'name':['z','q','s','s','g'],'cid':['c1','c2','c2','c3','c1'],'code':['1','2','3','3','2']}) print (df2)#内连接df_inner=pd.merge(df1,df2,on=['name','cid'],how='inner') print (df_inner)#左连接df_left=pd.merge(df1,df2,on=['name','cid'],how='left') print (df_left)#右连接df_right=pd.merge(df1,df2,on=['name','cid'],how='right') print (df_right)#全外连接df_outer=pd.merge(df1,df2,on=['name','cid'],how='outer') print (df_outer)#joindf1=pd.DataFrame({'name':['z','q','s','l']})print (df1)df2=pd.DataFrame({'cid':['c1','c2','c3']}) print (df2)df_join=df1.join(df2)print (df_join)#元素两两组合-笛卡尔乘积list1=['z','q','s','l']list2=['c1','c2','c3']list3 = [(x,y) for x in list1 for y in list2]print (list3)for x in product(list1, list2): print (x)for x in product(list1, repeat=4): print (x)nums = itertools.permutations(list2)#自身组合for x in nums: print(x)
阅读全文
0 0
- 【数据平台】python数据集连接和组合
- 【数据平台】基于pymysql库python连接mysql
- python oracle扩展安装和数据连接
- 数据科学部门如何使用Python和R组合完成任务
- python 2.7 数据连接
- 8.4 组合数据和行为
- Python读写OneNET平台数据
- 搭建python数据分析平台
- 搭建python数据分析平台
- 数据组合
- python连接mysql 查询数据
- python连接elasticsearch获取数据
- python连接mysql ---处理数据
- 【数据平台】基于pyhs2库Python作为client driver连接HiveServer
- 数据分析和可视化平台
- python数据分析4:双色球 两个红和蓝球哪组合比例高
- 【数据平台】python中文分词工具jieba
- Python 数据集处理之连接与追加
- Ado.Net调用带输入,输出参数的存储过程
- 腾讯云IM离线推送
- 关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- The Little Redis Book中文版 第五章
- 数据结构-单链表节点的获取
- 【数据平台】python数据集连接和组合
- 大专技术支持学Linux云计算4个月搞定年薪12万
- 工作汇报神技!用Python三步生成带有图表的word报表
- freemarker的Boolean类型,在JavaScript转成Boolean类型
- 五分钟搞定Bash功能与使用技巧
- 分析unity source 4.3.1f1 源代码
- 买房子2
- 记在前面的话
- The Little Redis Book中文版 总结