sklearn.naive_bayes中Bernoulli NB几种朴素贝叶斯分类器

区别:

几种朴素贝叶斯分类器的区别在于对于技术分享分布的假设,即假设技术分享满足的形式。

一、高斯NB

导入

from sklearn.naive_bayes import GaussianNB

假设特征的似然函数满足,

技术分享

技术分享 和 技术分享采用“最大似然估计” 

 

二、Multinomial NB

导入

from sklearn.naive_bayes import MultinomialNB

 特征是离散值,通常用样本的概率去估计技术分享

为避免有的特征值缺省,一般对样本的概率做Laplace平滑:(a=1时)

技术分享

 

三、Bernoulli NB

原型

class sklearn.naive_bayes.BernoulliNB(alpha=1.0binarize=0.0fit_prior=Trueclass_prior=None)

假设特征的似然满足多元Bernoulli分布,每个特征是一个二值变量

 

Bernoulli NB判别准则满足:

技术分享

区别于Multinomial NB

 

有文献证明,在短文本分类上Bernoulli NB可能优于Multinomial NB

 

文章来自:http://www.cnblogs.com/eniac1946/p/7407099.html
© 2021 jiaocheng.bubufx.com  联系我们
ICP备案:鲁ICP备09046678号-3