自己写的第一段可运行多段数据的Python代码。。

来源:互联网 发布:长安大学网络信息管理 编辑:程序博客网 时间:2024/05/07 01:25

千里之行,始于足下。这是第一段写的比较熟练的代码。刚开始学Python做数据分析,希望以后会慢慢懂的更多。

def loadDataSet(filename):dataMat=[];labelMat=[]fr=open(filename)for line in fr.readlines():lineArr=line.strip().split('\t')len1=len(lineArr)dataMat.append([float(lineArr[i]) for i in range(len(lineArr)-1)])labelMat.append(lineArr[-1])return dataMat,labelMat,len1

导入数据用的。我在机器学习实战中加了一小部分后面的代码
dataMat.append([float(lineArr[i]) for i in range(len(lineArr)-1)])
,避免了每次导入数据都需要提前打开数据库看一看有几行的问题。


注意,最后是len(lineArr)-1  len函数的作用是求出字符数组的个数。要少一个,不然把最后的那个label也算进去了

0 0
原创粉丝点击