vlambda博客
学习文章列表

智能财务风险预警方法—支持向量机

前言:财务预警是预防企业财务风险的重要举措。而构建智能财务风险预警模型则能协助公司迅速定位财务风险的潜在源头,避免大规模、高强度财务危机的爆发,对于已出现的财务风险有的放矢地采取针对性措施。本文介绍智能财务风险预警方法:支持向量机(Support Vector Machine,简称SVM),该方法是Cortes和Vapnik于1995年首先提出的一种线性分类,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

“大数据与人工智能环境下的智能财务风险预警方法”系列推文四:

一、支持向量机理论

支持向量机是统计模型中一个比较年轻的模型,也是一种非常实用的时间模型,它的主要理论依据是统计学习理论中的维度理论,并且遵循着结构风险最小的原则,主要应用在处理模式与识别的分类问题上,或者时间序列预测,判别样本等其他一系列判别方面的模型,此外,支持向量机还可以用在一些预测或者分析等领域,应用非常广泛,工程科学等方面都能有所应用。当今世界上的支持向量机支持向量机的研究部分中,实际和理论方面的研究两方在快速发展,如今支持向量机已经可以用于生物医学识别,文本识别,人脸识别,手写识别等非常多的领域。

支持向量机将分类样本映射为向量空间的特征向量集合,并在向量空间中构造最优分类超平面,使得在保证分类正确的同时,不同类别的集合与最优分类超平面的间隔最大。支持向量机算法最初提出是为了解决二元线性可分问题,目前 SVM 在线性可分、线性不可分等方面均有广泛的应用。支持向量机方法基于统计学习理论的VC维数理论和结构风险最小化原理,简言之,VC维度作为函数类的度量基本上是一个复杂的问题,如果VC维数较高,我们认为问题更复杂,直观地,H样本以H2的形式被所有可能的函数隔开,函数VC维度是它可以分离的最大样本数H,机器学习的本质是模型的真实性,显然,近似模型结果与实际之间存在一定的误差,我们认为这些错误的积累是一种风险,当我们把样本数据带入分类器,并将结果与实际结果进行比较时,我们可以得到一些误差,称为经验误差。对经验误差的单一研究通常不会产生我们想要的高分类精度的结果,有两个原因:第一,我们作为训练样本使用的数据是有限的,由于这部分数据不代表大量的其他样本数据,因此用于近似训练样本数据的模型只能反映某些距离测试数据的特征。第二,在大多数情况下,我们只追求这个经验误差的最小值,当经验误差最小化时,这并不意味着我们的模型完全适合于测试数据。在许多情况下,训练数据可以达到95%以上,在替换测试数据时,学习模型具有非常低的精度,因此,我们添加了置信风险的概念,它表明我们可以信任分类器对测试数据进行分类的程度,当训练样本数据较大时,近似模型学习的结果可能较好,VC维数越小,其促进能力越强,因此,我们寻求在一组训练样本数据的拟合精度和尽可能少地识别训练样本的能力之间取得平衡,以便获得更好的泛化能力。

二、支持向量机算法

SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用下图来说明。对于一维空间中的点,二维空间中的直线,三维空间中的平面,以及高维空间中的超平面,图中实心点和空心点代表两类样本,H为它们之间的分类超平面,H1,H2分别为过各类中离分类面最近的样本且平行于分类面的超平面,它们之间的距离叫做分类间隔(margin)。

设线性可分样本集为(Xi,Yi,i=1,,n,X∈R,Y∈{+1,-1}是类别符号。d维空间中线性判别函数的一般形式为是类别符号。d维空间中线性判别函数的一般形式为g(x)=w:x+b(w代表 Hilbert空间中权向量;b代表阈值。)分类线方程为w·x+b=0,将判别函数进行归一化,使两类所有样本都满足g(x)的绝对值为1,也就是使离分类面最近的样本g(x)的绝对值为1,此时分类间隔等于2/‖w‖,因此使间隔最大等价于使‖w‖(或‖w‖^2)最小。要求分类线对所有样本正确分类,就是要求它满足:

智能财务风险预警方法—支持向量机

满足上述条件,并且使‖w‖^2最小的分类面就叫做最优分类面,两类样本中离分类面最近的点且平行于最优分类面的超平面H1,H2上的训练样本点就称作支持向量(support vector),因为它们“支持”了最优分类面。

利用 Lagrange(拉格朗日)优化方法可以把上述最优分类面问题转化为如下这种较简单的对偶问题,即:在约束条件

智能财务风险预警方法—支持向量机

智能财务风险预警方法—支持向量机

下面对(主:对偶变量即拉格朗日乘子)求解下列函数的最大值

智能财务风险预警方法—支持向量机

若为最优解,则最优分类面的权系数向量是训练样本向量的线性组合。根据前面的分析,非支持向量对应的为0,因此上式中的求和实际上只对支持向量进行。b*是分类阈值,可以由任意一个支持向量通过式求得(只有支持向量才满足其中的等号条件),或通过两类中任意一对支持向量取中值求得。

通过分析可以看出,最优分类面是在线性可分的前提下讨论的,在线性不可分的情况下,就是某些训练样本不能满足条件,因此可以在条件中增加一个松弛项参数,变成:

智能财务风险预警方法—支持向量机

对于足够小的s>0,只要使

智能财务风险预警方法—支持向量机

最小就可以使错分样本数最小。对应线性可分情况下的使分类间隔最大,在线性不可分情况下可引入约束:

智能财务风险预警方法—支持向量机

在约束条件幂下对式求极小,就得到了线性不可分情况下的最优分类面,称作广义最优分类面。为方便计算,取s=1。为使计算进一步简化,广义最优分类面问题可以进一步演化成在条件的约束条件下求下列函数的极小值:

智能财务风险预警方法—支持向量机

其中C为某个指定的常数,它实际上起控制对错分样本惩罚的程度的作用,实现在错分样本的比例与算法复杂度之间的折衷。

对于非线性问题,可以通过非线性交换转化为某个高维空间中的线性问题,在变换空间求最优分类超平面。这种变换可能比较复杂,因此这种思路在一般情况下不易实现。

选择满足Mercer条件的不同内积核函数,就构造了不同的SVM,这样也就形成了不同的算法。目前研究最多的核函数主要有三类:

(1)  多项式核函数

智能财务风险预警方法—支持向量机

其中q是多项式的阶次,所得到的是q阶多项式分类器。

(2)  径向基函数

智能财务风险预警方法—支持向量机

所得的SVM是一种径向基分类器,它与传统径向基函数方法的基本区别是,这里每一个基函数的中心对应于一个支持向量,它们以及输出权值都是由算法自动确定的。径向基形式的内积函数类似人的视觉特性,在实际应用中经常用到,但是需要注意的是,选择不同的S参数值,相应的分类面会有很大差别。

(3)  S形核函数

智能财务风险预警方法—支持向量机

这时的SVM算法中包含了一个隐层的多层感知器网络,不但网络的权值、而且网络的隐层结点数也是由算法自动确定的,而不像传统的感知器网络那样由人凭借经验确定。此外,该算法不存在困扰神经网络的局部极小点的问题。从实验结果来看,对不同的数据库,不同的核函数各有优劣,而径向基核函数在多数数据库上得到略为优良的性能。

目前 SVM 是被各领域广泛应用的机器学习算法之一,为了适用于不同领域多样的数据,SVM 算法常与其他机器学习算法结合使用。

三、支持向量机的优点

支持向量机具有以下优点:

(1)科学性:拥有完整的理论体系,其思想核心是最大化分类边际;

(2)有效性:支持向量机是运用自身的内积核函数来解决非线性问题,即将非线性问题转化为核函数内的线性问题;

(3)实用性:它避开了传统的从归纳到演绎的繁杂过程,直接根据训练样本进行预测,简化了回归与分类问题;

(4)鲁棒性:对非支持向量样本的调整对模型本身没有影响,且对黑箱核函数的选择不敏感;

(5)可推广性:可以应用于包括财务预警在内的多种领域的研究,对构造函数的样本集没有特定的要求。

智能财务风险预警方法—支持向量机

四、支持向量机应用于智能财务风险预警

任何风险都是有迹象的,财务风险也不例外,在发生之前,会在采购,付款,生产,存货,销售,收款,企业名声等方面,或者财务管理等各个方面产生一系列异常的指标波动,智能财务风险预警主要基于大量数据分析。当前中国企业的形势相当复杂,综合来说,面临风险的主要原因有两个:外部因素和内部因素,但主要原因还是内部管理的问题,最终导致财务、公司治理等因素,这些因素最后会使得企业面临困境。企业内部控制的主要因素是多方面的,企业可以通过管理降低风险水平。然而外部原因(客观环境的变化及其影响),如法律政策背景的影响,行业变化的负面影响也可能导致企业面临风险,虽然这些原因对企业来说是可以预测的,但大多数企业也都无法避免,也无法控制。支持向量机模型用于预测上市公司的财务困境风险,其中支持向量机模型是线性的,映射关系解决了维度问题,该算法简单,准确,适合推广,该模型基于最小结构风险原则,决策面和阈值可以通过数值计算软件直接建立,极端解的结果是全局最优解,没有困扰神经网络方法的局部最小问题。因此,计算简单,具有良好的泛化能力与传统的神经网络相比,支持向量机模型可以在过去的经验数据和模型复杂度计算中选择更好的参数,使模型具有良好的预测性能。在实践中,实际样本数据点与假设预测点不同,因此在正常情况下,预测点可能有一些数据点更为重要,而其他一些点则不那么重要,特别是在预测中,在财务问题上,这些问题随着时间的推移在模型中发生了很大变化,找到误差和惩罚因子之间的平衡将影响算法的推广和预测精度和泛化能力。

支持向量机模型可以在以往的经验数据与模型的复杂度计算中,选取比较好的参数,从而使得模型具有良好的预测性能。在实际应用中,实际样本数据点与假设的预测点并不相同,所以在通常情况下,可能存在了某些数据点对于预测点更为重要,而其他某些点则不那么重要,尤其是财务风险的预测上,这些问题随着时间的推移而变化很大,在模型的训练样本数据中,寻找误差与惩罚因子的均衡将影响算法推广和预测准确性的能力。

一个值得信赖的财务预警模型,可以或许让企业的所有者对企业的财务运行状况有足够的重视。支持向量机相对于其他几种智能财务风险预警模型而言,其通过求解二次规划得到结果的方案,是一种高精度的全局最优解决方案。智能财务风险预警对于上市公司也是可以成为非常重要的一个方面,公司本身能及时的有效的发现潜在风险,也可以根据具体的财务状况情况来调节公司内部的经营方案,避免公司进入经营困境之中。


- End -


经邦大数据致力于数字赋能用户,实现风险可控下的运营价值最大化。目前已经在集团企业决策支持平台、AI分析建模平台、移动应用平台和大数据集成平台上取得丰硕成果,司企共建一批全国样板客户案例,获得业界良好口碑。基本企业全面风险管控体系的基础内控系统建设梳理与咨询指导、核心风控系统的开发建设与实施落地、评价优化系统的监督评价与优化改进等服务,最终实现企业风控目标与战略目标的统一。






精彩推荐




经邦 C9 智能财务决策支持软件
集团智能财务经营决策分析系统(BR)

智慧金融顾问决策支持系统SAF