pandas 的 pd.caoncat()

来源:互联网 发布:图片识别字体软件 编辑:程序博客网 时间:2024/06/05 15:37

简介:concat方法相当于数据库中的全连接(UNION ALL),可以指定按某个轴进行连接,也可以指定连接的方式join(outer,inner 只有这两种)。

用法

concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,            keys=None, levels=None, names=None, verify_integrity=False,copy=True

实例
在做数据挖掘时,我们常常把训练集和测试集合并。
so

import pandas as pdimport numpy as nptrain=pd.DataFrame(np.random.randn(3,4),columns=['a','b','c','result'])   test=pd.DataFrame(np.random.randn(2,3),columns=['a','b','c'])  train          a         b         c         result0  0.182840 -0.620581 -0.747044  0.5227771  1.187027  0.240775 -2.625450  1.8147282  0.923398  0.479424 -1.219073  0.309821test         a         b         c0 -0.659678  0.694842  0.2620171 -1.109733  1.381537  0.706843pd.concat([train.loc[:'a':'c'],test.loc[:,'a','c']])          a         b         c0  0.182840 -0.620581 -0.7470441  1.187027  0.240775 -2.6254502  0.923398  0.479424 -1.2190730 -0.659678  0.694842  0.2620171 -1.109733  1.381537  0.706843

说明
a、b、c 表示变量
result 表示预测或者分类结果

0 0
原创粉丝点击