在pandas 0.13中的 warning:settingcopywith

来源:互联网 发布:网络信息收集方法 编辑:程序博客网 时间:2024/06/07 21:02

在学习机器学习的过程

由于书本使用的PNADAS版本较老,于是便会出现同样的代码却会报错或者WARNING的问题。

这里用于记载我所遇到的一些问题和解决办法

遇到的第一个问题如下:

在对我的训练集进行特征赋值的时候,书本的代码如下:

X_train = train[selected_features]

在这里是将train这整个训练集中的特征提取后传给X_train,没有出现报错

而在进行如下操作(将Embarked列中缺失的数据填充)后,出现WARNING

X_train['Embarked'].fillna('S',inplace=True)

这里的warning如下:

SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

大意是指这个操作所填充的地方是在train这个DataFrame的一个副本之下进行的

代码可以执行,但出现警告的话,总归是有潜在风险的。

简单的解决办法是,直接为X_train创建一个新的特征提取后的Dataframe,如下操作:

X_train = train[selected_features]

变为

X_train = DataFrame(train[selected_features])

这里的X_train将被创建为一个全新的Dataframe, 不会再与train有任何关联。

应该就避免了一些潜在的操作风险。