ValueError: Input contains NaN, infinity or a value too large for dtype('float32'64). 一般处理方式

来源:互联网 发布:ubuntu 断点续传工具 编辑:程序博客网 时间:2024/06/02 06:00
 53         raise ValueError("Input contains NaN, infinity"

---> 54                          " or a value too large for %r." % X.dtype)

对于以上问题其原因一般是数据集中存在nan值,以下假设数据用numpy.ndarray存储(type(positive)=<class 'numpy.ndarray'>)。
首先,我们知道 if np.isnan(x) 用于判断x是否为nan,为nan则返回true。print(np.isnan(positive).any(), np.isnan(negative).any(), np.isnan(y).any())该语句用来判断positive、negative、y中是否存在nan值,若返回值为true,true,true,则可通过以下方式修改:positive[np.isnan(positive)] = np.mean(positive[~np.isnan(positive)])
negative[np.isnan(negative)] = np.mean(negative[~np.isnan(negative)])   也就是将positive、negative中的nan值用非nan值的均值代替,当然也可以用中位数median

等代替。再者,用print(np.isfinite(positive).all())     print(np.isfinite(negative).all())语句来判断positive、negative是否为有限值,返回false则表示数据存在无穷数,这个问题一般只要修改了nan值就不会报错了。

对于numpy.ndarray中的部分Nan的处理,例如,numpy.ndarray类型的array=[[2,4,nan,6,nan],[4,45,3,nan,nan]],可以通过以下代码进行处理:

 for i in range(len(array)):
                    sample=array[i]
                    for j in range(len(sample)):
                        if np.isnan(sample[j]):
                            sample[j]=0 
则array中的Nan均用0代替了。

(---python新手小小经验---)

1 0
原创粉丝点击