搜公众号
推荐 原创 视频 Java开发 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库
Lambda在线 > 马良来了 > 朴素贝叶斯--学习笔记

朴素贝叶斯--学习笔记

马良来了 2019-01-27
举报

这周没啥可说的,就晒晒学习笔记吧,给大家汇报一下,先上个脑图。

 


一、简介

朴素贝叶斯是基于条件概率的一种概率算法,容易实现,训练速度快,常应用于NLP自然语言处理等文本分析方向。

 

二、后验概率及已知推断

猜测门外走过的人是谁?已知信息(先验概率):

1、两人在办公室的时间一样长p(A)=p(B)=50%。

2、A、B每周穿红毛衣的次数分别是每周两次和三次,p(A)=40%,p(B)=60%(后验概率:利用红毛衣的信息求得的),假若走过的人穿了红毛衣,猜测是A或B的概率?根据已知信息,转化为概率信息,推断出穿红毛衣的人是A或B的概率?

 

三、再次猜测

处理复杂情况,改变先验概率,A、B在办公室的时长不同的情况下如何处理?利用条件概率公式,求出两者都在穿红毛衣的概率基础上,进行归一化。


朴素贝叶斯--学习笔记

 

四、贝叶斯定理

 


五、敏感性和特异性及医学案例

敏感性:正确诊断阳性的概率

特异性:正确诊断阴性的概率

警惕假阳性:暂时无解,误诊是很平常的事情,当遇见严重疾病时,确保不同的方法或手段诊断多次。当健康人误诊为有病时,这种情况需要保持镇定、不要慌,再次确诊才能保证诊断的结果是否正确。

 

六、如何在机器学习中应用

很简单:重复操作。需要注意的是:在NLP中,不分析单个单词的顺序,效果居然也很棒,比较反直觉。

 

七、垃圾邮件过滤

贝叶斯定理的要旨是从已知出发,推断结果。朴素的意思是:假设事件的发生概率是彼此独立的,然后运算得出一个比较理想的结果。

 

八、朴素贝叶斯、归一化

牢记:相互独立时,公式才成立;假设的先验概率很天真,也不一定成立,但是实践的效果很好,算法速度很快。归一化时,成比例很重要:

1、颠倒条件并获取比例

2、做出朴素假设并拆分为多个简单因子的积

3、归一化、标准化处理。


九、项目实践

1、读取和数据预处理

2、bag of words(令牌化字符串:用分隔符将句子拆成单词):转换小写字符、删除所有标点符号、令牌化、计算频率、然后导入sklearn实现

3、划分训练集和测试集、对数据应用BOW

4、sklearn实现朴素贝叶斯

5、评估模型:准确率、精确率、召回率、f1得分

6、总结

 

满满的干货,注重理解,没有枯燥严谨的数学公司,入门级内容,大神请高抬贵手。


亲,点个好看再走呗☺️

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《朴素贝叶斯--学习笔记》的版权归原作者「马良来了」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注马良来了微信公众号

马良来了微信公众号:MLLL_201706

马良来了

手机扫描上方二维码即可关注马良来了微信公众号

马良来了最新文章

精品公众号随机推荐

举报