朴素贝叶斯

来源:互联网 发布:朱元璋书法 知乎 编辑:程序博客网 时间:2024/05/22 00:14

机器学习是将数据转化为决策面的过程

scikit-learn缩写为sklearn

sklearn.naive_bayes.GaussianNB

训练一个分类器,学习之后预测其处理的准确性:

def NBAccuracy(features_train, labels_train, features_test, labels_test):    from sklearn.naive_bayes import GaussianNB    clf = GaussianNB()    clf.fit(features_train, labels_train)    pred = clf.predict(features_test)# labels_test的标签是我们之前就打好的,所以可以预测准确性     accuracy = clf.score(features_test, labels_test)    return accuracy

贝叶斯规则

事实上,贝叶斯更像是这样的一种表示

这里写图片描述

朴素贝叶斯用于判断文本中是否有哪个关键字有很强的优势,然而却不能用于判断句子顺序。用改模型可以判断作者写作风格,进而判断邮件作者是谁。

扩展阅读

贝叶斯推断及其互联网应用

用机器学习模型推断出某名不见经传的作者其实是JK罗琳

原创粉丝点击