Python sklearn包中的一些小函数笔记

来源：互联网发布：网络简介阅读答案编辑：程序博客网时间：2024/05/22 09:42

一、切分训练集，测试集

from sklearn.model_selection import train_test_split#随机 划分30%作为测试集       random_state=531xTrain,xTest,yTrain,yTest = train_test_split(X,y,test_size=0.3,random_state=531)

二、计算均方误差（也可以自己算，就是简单嘛）

from sklearn.metrics import mean_squared_errormean_squared_error(yTest,p)

三、计算正确个数，正确率

from sklearn.metrics import accuracy_scorecorrect = accuracy_score(yTest,preditions)   #就是简单的比较正确的个数，normalize=True 则返回正确的概率

四、混淆矩阵（可以反映每个类中，预测正确的个数）

from sklearn.metrics import confusion_matrixconfusionMat = confusion_matrix(yTest,pList)

五、train_score_（这个参数有没有，依模型而定）

#GradientBoosting有，RandomForest没有#每次迭代，训练集产生的误差（deviance）#mean_squared_error,missClassErrorplt.plot(range(1,nEst+1),glassGBMModel.train_score_,label='Training Set Mse',linestyle = ':')

阅读全文

0 0