vlambda博客
学习文章列表

朴素贝叶斯公式的理解

朴素贝叶斯


2019.11.21


1. 引言

贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。


2. 贝叶斯公式

贝叶斯公式就一行:

而它其实是由以下的联合概率公式推导出来:

其中P(Y)叫做先验概率,P(X|Y)叫做后验概率,P(Y,X)叫做联合概率。

结论 P(X,Y)联合概率 ==P(Y)先验概率 ×P(x|y)后验概率

没了,贝叶斯最核心的公式就这么些。

下面是对贝叶斯的一些理解

P(x,y)联合概率,即x,y同时发生的概率。


p(x,y)联合概率,xy同时发生的概率=p(x)x发生的概率 ×   p(y|x) x条件下Y发生的概率  


p(x,y)联合概率,xy同时发生的概率=p(y)y发生的概率 ×    p(x|Y) y条件下x发生的概率 


 


以p(x,y)=p(y|x)*p(x)=p(x|y)*p(y)


在一个大的统计样本之中  p(X),p(Y),P(x|Y)  P(y|x)的概率都是可以从样本中统计得来  所以一切都变得可以计算,我们假设所有的样本 都符合这样的xy 联合分布  那么就可以计算出我们想要的结果  比如在P(Y|X) 在X特征下属于Y的概率


P(X)= x特征的总样本/ 所有样本


P(y|x)= x特征中属于Y的样本数量/x特征所有样本


P(Y) = 属于y类的样本/所有样本


p(x|y)=y类中有x特征的样本/y的总样本