机器学习(朴素贝叶斯)
概率基础知识
乘法公式:由条件概率公式得
乘法公式推广:对于任何正整数,当时有:
全概率公式:若事件两两互斥,即,并且
,则对任意一个事件,有如下公式成立
贝叶斯公式:由上面几个公式不难推出下面公式
朴素贝叶斯分类算法
现在我们将上述贝叶斯公式应用到机器学习算法中,分类任务是已知特征预测类别的有监督学习任务,上述贝叶斯公式可写为:
假设现在有个二分类问题,根据男士条件来预测女士嫁与不嫁,具体数据如下表:
身高 |
长相 |
收入 |
嫁与否 |
高 |
帅 |
高 |
嫁 |
矮 |
丑 |
低 |
不嫁 |
高 |
丑 |
低 |
不嫁 |
高 |
丑 |
高 |
嫁 |
矮 |
帅 |
低 |
不嫁 |
矮 |
丑 |
高 |
不嫁 |
矮 |
帅 |
高 |
嫁 |
高 |
丑 |
高 |
嫁 |
已有历史数据,现来了一个男士新的特征(矮,帅,高),来进行预测嫁与不嫁,根据贝叶斯公式我们可以得到以下两个公式,比较两个值的大小就可以预测出嫁与不嫁,不难看出我们只需要比较分子的大小就可以。
朴素贝叶斯算法假设各个特征之间相互独立,所以
可见,所以预测结果为嫁。
拉普拉斯平滑
加入拉普拉斯平滑后,我们看下特征(矮,帅,低)在嫁与不嫁的概率结果,
接下来就要用第二个公式求,其中,则最后概率为1/2。所以分子部分的概率为1/72。接下来用同样的方法求的分子部分概率为:
其中分子部分为:
后者概率大于前者,所以预测为不嫁。
频率派VS贝叶斯派
具体不同,可查看
https://www.zhihu.com/question/20587681
朴素贝叶斯分类算法的优缺点