搜公众号
推荐 原创 视频 Java开发 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库
Lambda在线 > 交易风控技术栈 > 机器学习的分类与贝叶斯公式推导

机器学习的分类与贝叶斯公式推导

交易风控技术栈 2019-04-09
举报

HELLO

大家好,今天跟大家简要介绍两个金融风控策略体系会常用到的两个知识点。知识点一是机器学习的基本方法以及在金融策略中的应用,知识点二为贝叶斯概率公式的推导及在风控中的应用。

1、知识点一

首先进行知识点一的理解展示。目前常用机器学习的方式可以分为有监督学习、无监督学习以及强化学习。用一个简单的示例图来帮助大家形象的了解这三种学习方式的区别。


给出命题:今天是晴天,我们要预测张朋午饭要吃什么;假设已知的因变量为天气状况,且天气可能为三种情况:1)晴天2)阴天3)雨天;结果食物套餐选型有三种:1)大杂烩2)烤串3)寿司卷;这个问题可以用三种上述方式去进行学习。

机器学习的分类与贝叶斯公式推导


有监督学习:有监督学习知道预测的标签值,它通过寻找并定义自变量(属性:X)与因变量(预测标签:Y)之间的关系,以实现通过X预测Y的目的。

如上示例图所示,如果需要知道张朋今天吃什么,可以尝试将其之前的就餐数据进行归类统计获得张朋午饭习惯的标签数据即:(晴天,大杂烩),(阴天,烤串),(雨天,寿司卷);由此对应出今天晴天的午餐结果为:大杂烩。

机器学习的分类与贝叶斯公式推导

无监督学习:无监督学习不知道预测标签,它是在复杂数据中不断挖掘并寻找数据之间的关系,而不是通过选取自变量预测因变量。

如上示例图所示,如果需要知道张朋今天吃什么,在无法知晓张朋的历史午餐列表记录的情况下,可以尝试将其与同类的人群进行对比,将其归类为相似性强的组群;由图示,可知张朋在晴天的今天跟晴天吃大杂烩的A组更相似,因此,预测张朋今天会选择大杂烩。

 

机器学习的分类与贝叶斯公式推导

强化学习:强化学习也不知道预测标签,它是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。

如上示例图所示,如果需要知道张朋今天吃什么,在无法知晓张朋的历史午餐列表记录的情况下,可以尝试根据每天的天气情况对张朋的菜谱进行尝试调整,以最优化张朋的情绪反馈为目标,从而学习到张朋的饮食习惯情况;由图示,可知张朋在晴天的情况下提前进行了四次尝试,得出张朋最在晴天的时候更倾向于吃大杂烩的情况,因此,在是晴天的今天为张朋提供大杂烩为午餐是最优的选择。

机器学习的基本方法在我们风控场景中也有着多方面的应用。例如,有监督学习常用于侦测交易反欺诈中,以案件作为标签值,结合业务分析的输入属性,进行有监督的学习,从而达到案件排查的效果。此外,在进行客户画像加工的过程中,又常常会使用到一些无监督学习的算法,因为该类场景是没有明确的标签值的,此时通过一些无监督的聚类算法来获取我们所需的标签值。

2、知识点一

好了,说完了第一点,接下来进行我们第二个知识点的介绍。概率论在金融风控业务中有着广泛的应用,今天我们将要的来聊一下贝叶斯定理的一种推导过程。说到概率,我们首先要解释的一个基本概念就是随机事件。随机事件是指在相同条件下,可能出现也可能不出现的事件。比如,今天可能下雨,也可能不下雨;抛一枚硬币,结果可能是正面,也可能是反面。

机器学习的分类与贝叶斯公式推导

概率就是反映随机事件出现的可能性大小的量度。由下图示,概率数学表示为P(A)=A/S所含样本点数/总体所含样本点数。其中S总体样本集。

机器学习的分类与贝叶斯公式推导

如何理解概率和随机事件的关系呢?可以理解为:概率的本质是函数(一种映射关系),它能提供这种函数映射,将一件抽象事件具象化为一个取值在[0,1]的实数,便于后续的建模运算。

类似的,我们给出相应的两个概念。条件概率,是指事件A在另外一个事件B已经发生条件下的发生概率。联合概率,表示两个事件共同发生的概率。表示为P(AB),P(A,B)或者P(AB)。

 

接下来进行贝叶斯条件概率的推导。

P(B|A) = P(A∩B)/P(A)    ..........(1)

P(A|B)= P(A∩B)/P(B)      ..........(2)

由公式(1)得:

P(A∩B) = P(B|A)P(A)       ..........(3)

由公式(3)和公式(2)结合,有:

       P(A|B) = P(B|A)P(A)/P(B)..........(4)

 

公式(4)便是大名鼎鼎的贝叶斯定理了。贝叶斯概率在风控场景的应用也是很广泛的,在一些反欺诈交易的场景中,贝叶斯定理的应用能很好结合先验概率、后验概率与真实样本集的关系,产生合理的指标数据。

 

今天的分享内容到这里就结束了,内容准备的匆忙,可能会有不对的地方,还请大家指正,谢谢!


        看完本文有收获?请转发分享给更多人吧~~


版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《机器学习的分类与贝叶斯公式推导》的版权归原作者「交易风控技术栈」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注交易风控技术栈微信公众号

交易风控技术栈微信公众号:tsds-aegis

交易风控技术栈

手机扫描上方二维码即可关注交易风控技术栈微信公众号

交易风控技术栈最新文章

精品公众号随机推荐

举报