sklearn总结
来源:互联网 发布:软件用户说明书 编辑:程序博客网 时间:2024/06/11 22:55
对莫老师的sklearn做一下总结。莫老师传送门并且结合scikit中文文档和scikit英文文档,对学习的内容做一下总结。这篇博客写的也不错传送门。
注意:sklearn中scores函数的准确率是样本均衡后的准确率。
accuracy_score(y, self.predict(X),sample_weight=sample_weight)
加载数据
iris = datasets.load_iris()iris_X = iris.datairis_y = iris.targetloaded_data = datasets.load_boston()data_X = loaded_data.datadata_y = loaded_data.targetX, y = datasets.make_regression(n_samples=100, n_features=1, n_targets=1, noise=10)# 自己模拟生成的虚拟数据X, y = make_classification(n_samples=300, n_features=2 , n_redundant=0, n_informative=2, random_state=22, n_clusters_per_class=1, scale=100) # 产生随机数据
数据预处理
##数据零均值标准方差scaler = preprocessing.StandardScaler().fit(X)#得到X的均值和方差scaler.transform(X) # 对X进行归一化处理,可以同样运用于测试集##数据缩放到【0,1】范围内min_max_scaler = preprocessing.MinMaxScaler()##单位范数X_normalized = preprocessing.normalize(X, norm='l2')
训练集和测试集分离
X_train, X_test, y_train, y_test = train_test_split( iris_X, iris_y, test_size=0.3)train_test_split(X, y, random_state=4) #随机分离??
模型训练
knn = KNeighborsClassifier()knn.fit(X_train, y_train)model = LinearRegression()model.fit(data_X, data_y)clf = SVC()clf.fit(X_train, y_train)
模型预测
knn.predict(X_test)model.predict(data_X[:4, :]) #只查看前几个样本
模型评估
#利用metrics输出模型性能print(metrics.classification_report(expected, predicted))print(metrics.confusion_matrix(expected, predicted))print(clf.score(X_test, y_test)) #输出准确率model.score(data_X, data_y) ##5折交叉验证scores = cross_val_score(knn, X, y, cv=5, scoring='accuracy')print(scores) #打印准确率print(scores.mean()) #打印准确率的均值#分类问题以及参数选择:for k in k_range: knn = KNeighborsClassifier(n_neighbors=k) loss = -cross_val_score(knn, X, y, cv=10, scoring='mean_squared_error') k_scores.append(loss.mean())#回归问题以及参数选择:for k in k_range: knn = KNeighborsClassifier(n_neighbors=k) scores = cross_val_score(knn, X, y, cv=10, scoring='accuracy') k_scores.append(scores.mean())#经典参数选择策略GridSearchCVRandomizedSearchCV
模型保存
# method: joblibfrom sklearn.externals import joblib# Savejoblib.dump(clf, 'save/clf.pkl')# restoreclf3 = joblib.load('save/clf.pkl')print(clf3.predict(X[0:1]))
阅读全文
0 0
- sklearn总结
- sklearn技巧总结
- sklearn使用总结
- sklearn的一些技巧总结
- Sklearn
- sklearn
- sklearn
- Sklearn
- python/sklearn/theano中随机数总结
- sklearn的svc参数总结及cross_validation
- [051]python之matplotlib,numpy,sklearn总结
- 总结:sklearn机器学习之特征工程
- sklearn机器学习常用过程总结
- sklearn机器学习常用数据处理总结
- DM02-sklearn特征选择总结与Demo
- 预处理数据的方法总结(使用sklearn-preprocessing)
- 机器学习逻辑回归模型总结——从原理到sklearn实践
- sklearn学习——SVM例程总结1(outlier and unbalanced classes)
- 欢迎使用CSDN-markdown编辑器
- 如何在Android Studio中快速的写javabean的set和get方法
- Building a RESTful Web Service
- linux 块设备驱动(1)
- ch2 gpio应用:Buzzer封装
- sklearn总结
- Spring容器中Bean的生命周期(init-method destroy-method)
- Java单元测试工具:JUnit4(二)——JUnit使用详解
- [RK3288][Android6.0] Audio中的混音过程小结
- Linux_Kafka 安装笔记
- vue js 的生命周期和钩子函数
- 集合总结笔记——ArrayList/LinkedList
- SOA开发-02 两个4层架构规范
- Android 方法数超出 65536限制的解决方法