用sklearn进行线性分类
来源:互联网 发布:浩方对战平台mac版 编辑:程序博客网 时间:2024/06/03 18:04
这里通过LogisticRegression分类器和随机梯度分类器对一些肿瘤数据进行分类,分出是良性还是恶性
代码来自《python机器学习及实践》
#pandas用于处理数据import pandas as pd import numpy as np#将数据分割为训练集和测试集from sklearn import train_test_split#用于标准化数据 from sklearn.preprocessing import StandardScaler#一种线性分类技术 from sklearn.linear_model import LogisticRegression#一种线性分类技术 from sklearn.linear_model import SGDClassifier #用于分析数据 from sklearn.metrics import classification_report #所有的属性和编号,标签colum_names = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape', 'Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin', 'Normal Nucleoli', 'Mitoses', 'Class']#从csv文件中读入数据 data = pd.read_csv('data.csv', names = colum_names) #将?用nan(非数字)替代data = data.replace(to_replace='?', value=np.nan)#放弃含有nan的数据 data = data.dropna(how='any') X_train, X_test, y_train, y_test = """属性为每行的1-9号值(左闭右开)label为每行的第11个属性测试集占25%随机数的种子为33"""train_test_split(data[colum_names[1:10]], data[colum_names[10]], test_size=0.25, random_state=33) ss = StandardScaler()X_train = ss.fit_transform(X_train)X_test = ss.fit_transform(X_test)lr = LogisticRegression()sgdc = SGDClassifier()lr.fit(X_train, y_train)lr_y_predict = lr.predict(X_test) #用fit之后的结果对X_test进行预测sgdc.fit(X_train, y_train)sgdc_y_predict = sgdc.predict(X_test)#对X_test的预测结果与y_test进行对比print('Accuracy of LR Classifier:', lr.score(X_test, y_test))#输出y_test与预测结果的对比 print(classification_report(y_test, lr_y_predict, target_names=['Benign', 'Malignant'])) print('Accuarcy of SGD Classifier:', sgdc.score(X_test, y_test))print(classification_report(y_test, sgdc_y_predict, target_names=['Benign', 'Malignant']))
阅读全文
1 0
- 用sklearn进行线性分类
- 用 sklearn 库决策树分类器进行收入水平分类(一)
- 用Sklearn做判别分析(分类)
- Python:用Word2Vec 和 sklearn 对IMDB评论进行分类训练
- 利用sklearn包中的k-近邻算法进行分类
- python进行文本分类,基于word2vec,sklearn-svm对微博性别分类
- 机器学习分类之结合实际应用介绍KNN算法原理以及利用sklearn进行分类预测
- sklearn一元线性回归
- sklearn--线性回归
- sklearn之线性模型
- sklearn中的线性回归
- (sklearn)线性判别分析LinearDiscriminantAnalysis
- sklearn 里的分类
- sklearn 用于文本分类
- sklearn分类算法汇总
- sklearn之分类决策树
- sklearn分类器
- sklearn中ababoost分类
- const定义的变量,可以作为数组[ ]里面的值吗?
- 非常完善的Log4net详细说明
- PHP生成二维码
- ACM数论基础训练题解之求最大公约数
- codeforces Hacker, pack your bags!
- 用sklearn进行线性分类
- 减少网页加载时间的6个技巧
- 中国Win10市场份额全面超越XP,仅次于Win7
- 基于jenkins的自动化单元测试实践
- Rxjava浅理解
- 解析C语言结构体及位段
- java-验证码
- Java 集合系列05之 LinkedList源码解析
- 面向对象8---内部类