基于概率论的分类方法:朴素贝叶斯

来源:互联网 发布:胡公子的淘宝店叫啥名 编辑:程序博客网 时间:2024/05/01 07:17

朴素贝叶斯
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据

朴素贝叶斯的一般过程

  1. 收集数据:
  2. 准备数据:需要数值型或者布尔型数据
  3. 分析数据:有大量特征时,绘制特征作用不大,此时使用直方图效果更好
  4. 训练算法:计算不同的独立特征的条件概率
  5. 测试算法:计算错误率
  6. 使用算法:一个常见的朴素贝叶斯应用是文档分类。可以在任意的分类场景中使用朴素贝叶斯分类器,不一定非要是文本

Universal Feed Parser 是Python中最常用的 RSS 程序集

0 0