机器学习入门-分类器入门
来源:互联网 发布:tensorflow实战视频 编辑:程序博客网 时间:2024/04/30 11:09
餐厅评价分类
线性分类器
决策边界
训练分类器=学习权重
混淆矩阵
不同一应用中不同类型的错误的成本也会不同
模型需要学习多少数据
类别概率
总结
import graphlabproducts = graphlab.SFrame('amazon_baby.gl/')products.head()
构建词袋向量(添加一列)products['word_count'] = graphlab.text_analytics.count_words(products['review'])products.head()
探索流行商品products['name'].show()抽取特定数据giraffe_reviews = products[products['name'] == 'Vulli Sophie the Giraffe Teether']len(giraffe_reviews)giraffe_reviews['rating'].show(view='Categorical')
情感分析products['rating'].show(view='Categorical')利用评分来判断情感(3中性评价去掉,1,2是负面的,4,5是正面的)products = products[products['rating'] != 3]正面为1,负面为0products['sentiment'] = products['rating'] >= 4
训练情感分类器(交叉验证,训练)train_data,test_data = products.random_split(.8,seed=0)sentiment_model = graphlab.logistic_classifier.create(train_data,target='sentiment',features=['word_count'],validation_set=test_data)
评估情感模型(使用roc曲线测试集,auc是面积,面积越大,效果越好)sentiment_model.evaluate(test_data,metric='roc_curve')sentiment_model.show(view='Evaluation')
使用模型预测情感(输出概率倾向)giraffe_reviews['predicted_sentiment'] = sentiment_model.predict(giraffe_reviews,output_type='probability')基于预测情感降序排序,方便观察giraffe_reviews = griaffe_reviews.soft('predicted_sentiment',ascending=False)giraffe_review.head()查看评价giraffe_reviews[0]['review']giraffe_reviews[-1]['review']
阅读全文
0 0
- 机器学习入门-分类器入门
- Tensorflow MNIST机器学习入门 分类学习
- 机器学习通俗入门-朴素贝叶斯分类器
- 机器学习简易入门(二) - 分类
- 机器学习中的多分类任务入门
- 机器学习入门——机器学习分类
- 机器学习通俗入门-Softmax 求解多类分类问题
- 机器学习入门——回归与分类
- 程序员的机器学习入门笔记(五):文本分类的入门介绍
- 机器学习入门资料
- 机器学习入门
- 机器学习入门
- 机器学习入门
- 机器学习入门
- 机器学习入门
- 机器学习入门
- 机器学习入门,神经元模型
- 机器学习入门指南
- 【JavaSE学习笔记】IO流05_字符缓冲输出流BufferedWriter、字符缓冲输入流BufferedReader
- 【二分匹配入门专题1】J
- HTML 笔记
- 将一个N*N的矩阵逆转90度
- 常用的字符串处理库函数的C语言实现
- 机器学习入门-分类器入门
- java预操作多行sql语句
- python学习(九)----pandas模块相关函数
- 阿里云CentOS被minerd入侵,CPU使用率高达100%
- error LNK2001: 无法解析的外部符号 __imp__RegEnumKeyExA@32
- 用自定义布局实现仿IOS的dialog布局
- 【NYOJ-92- 图像有用区域-BFS】
- 大型php网站性能和并发访问优化方案
- Android——适配器Adapter类