tensorflow随笔2

来源:互联网 发布:linux vi如何保存退出 编辑:程序博客网 时间:2024/05/16 08:04

在训练数据的时候,一直在纠结一个点,是关于数据清洗,当然还有其他数据预处理的流程,这里不提,以后补充,数据清洗有什么好处?

1 降低噪声干扰

2 降低样本的随机性

这一次是关于数据混洗的代码,提供两种方法,在数据预处理的时候,我自己用上了以后,降低了样本数据的偶然性,其实偶然理解为随机也可以。数据是平稳的,话不多说,上代码;

#数据混洗#方法1import numpy as npa=np.array([1,2,3,4,5])arr=np.arange(9).reshape((3,3))np.random.shuffle(a)print('a混洗后:\n',a)print('混洗前:\n',arr)np.random.shuffle(arr)print('混洗后:\n',arr)#方法2indices=np.random.choice(len(a),len(a),replace=None)x=a[indices]print('a混洗后:\n',x)
方法一是利用numpy里的shuffle函数,达到混洗的目的,对于数组而言,该函数打乱顺序,而对于arr矩阵而言,恰好是行与行之间打乱顺序,其实道理跟数组一样,比较所以矩阵也是按数组存储,方法二是用numpy里的choice函数,意思是范围0-len(a)里选出0-len(a)的索引,一样也可以吧这些索引保存到list里,然后将打乱的索引值赋给一个新值,这样就达到了混洗的目的。

看看运行效果:

a混洗后: [4 3 2 1 5]混洗前: [[0 1 2] [3 4 5] [6 7 8]]混洗后: [[0 1 2] [3 4 5] [6 7 8]]a混洗后: [2 3 5 1 4]





原创粉丝点击