tensorflow随笔2

来源：互联网发布：linux vi如何保存退出编辑：程序博客网时间：2024/05/16 08:04

在训练数据的时候，一直在纠结一个点，是关于数据清洗，当然还有其他数据预处理的流程，这里不提，以后补充，数据清洗有什么好处？

1 降低噪声干扰

2 降低样本的随机性

这一次是关于数据混洗的代码，提供两种方法，在数据预处理的时候，我自己用上了以后，降低了样本数据的偶然性，其实偶然理解为随机也可以。数据是平稳的，话不多说，上代码；

#数据混洗#方法1import numpy as npa=np.array([1,2,3,4,5])arr=np.arange(9).reshape((3,3))np.random.shuffle(a)print('a混洗后：\n',a)print('混洗前:\n',arr)np.random.shuffle(arr)print('混洗后:\n',arr)#方法2indices=np.random.choice(len(a),len(a),replace=None)x=a[indices]print('a混洗后：\n',x)

方法一是利用numpy里的shuffle函数，达到混洗的目的，对于数组而言，该函数打乱顺序，而对于arr矩阵而言，恰好是行与行之间打乱顺序，其实道理跟数组一样，比较所以矩阵也是按数组存储，方法二是用numpy里的choice函数，意思是范围0-len(a)里选出0-len(a)的索引，一样也可以吧这些索引保存到list里，然后将打乱的索引值赋给一个新值，这样就达到了混洗的目的。

看看运行效果：

a混洗后： [4 3 2 1 5]混洗前: [[0 1 2] [3 4 5] [6 7 8]]混洗后: [[0 1 2] [3 4 5] [6 7 8]]a混洗后： [2 3 5 1 4]

阅读全文

0 0