标签二值化LabelBinarizer

来源:互联网 发布:淘宝买家金钻好处 编辑:程序博客网 时间:2024/04/30 13:51

对于标称型数据来说,preprocessing.LabelBinarizer是一个很好用的工具。比如可以把yes和no转化为0和1,或是把incident和normal转化为0和1。当然,对于两类以上的标签也是适用的。这里举一个简单的例子,说明将标签二值化以及其逆过程。

# -*- coding: UTF-8 -*-from sklearn import preprocessingfrom sklearn import tree# help(preprocessing.LabelBinarizer)#取消注释可以查看详细用法# 特征矩阵featureList=[[1,0],[1,1],[0,0],[0,1]]# 标签矩阵labelList=['yes', 'no', 'no', 'yes']# 将标签矩阵二值化lb = preprocessing.LabelBinarizer()dummY=lb.fit_transform(labelList)# print(dummY)# 模型建立和训练clf = tree.DecisionTreeClassifier()clf = clf.fit(featureList, dummY)p=clf.predict([[0,1]])# print(p)#取消注释可以查看p的值# 逆过程yesORno=lb.inverse_transform(p)print(yesORno)
原创粉丝点击