元用一个多输入、单输出的非线性节点表示,如图3:
x1 w 1 i 阀值? i 激活函数
x2 w 2 i I yi
输入信号 求和
?if(.)xn wni 连接权
图3 人工神经元模型
神经细胞i的人工神经元的输入输出关系可以描述为:
?Ii??wjixj??i?j?1?yi?f?Ii???n (4.1)
式(3.1)中,xj由细胞j传送到细胞值,?i是细胞i的阀值,
I输入量。wji是从细胞到细胞的连接权
f是传递函数,yi是细胞i的输出量。
神经元上的传递函数,是样本由输入层神经元传递到输出层神经元时进行的变换。传递函数有很多种,但常用的基本传递函数有以下三种:
(1) 阀值函数
f?Ii??
?1,若Ii?00,若Ii?0 (4.2)
式(4.2)也通常称为阶跃函数,若传递函数采用阶跃函数,则人工神经网络即
17
为著名的MP模型。此时神经元输出取0或1,反映了神经元的兴奋或抑制。
(2)分阶线性函数
f?Ii???1,若Ii?1Ii,若1?Ii??10,若Ii??1 (4.3)
式(4.3)在[-1,+1]线性区内的放大系数是一致的,这种形式的传递函数可以看作是非线性放大器的近似。有两种情况时分段函数的特殊形式,一是若在执行中保持现行区域而使其不进入饱和状态,则会产生线性组合器;二是若线性区域的放大倍数无限大,则分段线性函数简化为阀值函数。
(3)Sigmoid函数
Sigmoid函数也称为S型函数。到目前为止,它是人工神经网络中最常用的激励函数。S型函数定义如下:
1f?Ii?=1+e?aIi (4.4)
式(4.4)中a是Sigmoid函数的斜率参数,通过改变参数a,我们会获取不同斜率的Sigmoid函数。当斜率参数接近无穷大时,此函数转化为简单的阀值函数,但Sigmoid函数对应[0,1]一个连续区域,而阀值函数对应的只是0和1两个点,此外,Sigmoid函数是可微的,而阀值函数是不可微的。 4.1.2 神经网络模型的应用可行性
神经网络模型对任意函数具有逼近能力、学习能力、自组织和自适应能力,能够比较精确的描述因素之间的映射关系。并且神经网络模型在应用中的优势在于,它结构简单,学习方法快,推广能力优异。因而可以对于商业银行的信用风险进行一个较为准确的评估。
神经网络在很大程度上克服了统计模型方法的不足,特别是针对信用风险评估系统的应用特点和数据特点,神经网络表现出更好的针对性和适用性。
(1)神经网络适合处理连续型的数据。对于以财务指标为主的信用风险评估,对连续型数据的处理能力及处理结果的准确性十分重要。
(2)神经网络对噪声数据具有较高的承受能力,在经过一定数量的带噪声的样本训练后,神经网络仍然具有很好的泛化能力。对于分类精度要求较高的信用风险评估问题,神经网络对噪声数据的承受能力使评估模型具有稳定的分类准确率。
18
(3)神经网络对数据分布要求不严格,也不必要详细表述自变量与因变量之间的函数关系。对数据分布的假设是限制传统的信用风险评估方法应用的主要原因,因为大多数信用数据都是随机分布的。
(4)非线性映射能力。在现实世界中,大多数数据关系都是非线性关系,比如信用风险评估指标和信用风险等级之间的关系。神经网络的非线性映射能力使信用风险评估模型更具科学性和准确性。
在信用风险评估系统中,神经网络最主要的任务是从历史数据集中学习隐含在其中的知识,揭露信用风险评估指标之间的内在关系,并建立同实际情况一致的信用风险评估模型。由此可见,神经网络的学习算法对信用风险评估系统有着十分关键的意义。
4.2 基于神经网络模型的信用风险评估模型建立
4.2.1 模型的研究方向
有了合理的建模方法,并不意味着得到了合理的信用风险评估模型。单从模型的角度看,合理的评估模型是必须在具有合理的隐含层节点数、训练时没有发生“过拟合”现象、求得全局极小点和同时考虑网络结构复杂度和误差大小的综合结果。而从全局角度看,合理的评估模型还包括信用风险评估指标体系、样本数据准备及其模式划分、指标数据的预处理方法和评估模型的泛化和改进等等。为了得到合理的信用风险评估模型,本文将从以下方面展开研究。
(1)建立科学、完善和适用的信用风险评估指标体系。这是建立合理的信用风险评估模型的首要条件,因为只有对正确的指标进行学习和分析,才可能得到正确的模型。指标体系的建立包括指标的确定和指标数据的预处理等。
(2)确定评估模型的网络结构。评估模型的输入节点数量由评估指标决定,输出节点数量由信用等级数量确定,而隐含层节点数量是确定模型网络结构的难点。 (3)样本数据的准备。采用 BP 神经网络方法建模要求有足够多的典型性好和精度高的样本。为监控训练过程使之不发生“过拟和”和评价建立的网络模型的性能和泛化能力,必须将收集到的样本数据随机分成训练样本和测试样本(20%)两个部分,数据分组时还应尽可能考虑样本模式间的平衡。
(4)评估模型的训练。BP 网络模型的训练是通过应用误差反传原理不断调整网
19
络权值,使网络模型输出值与已知的训练样本输出值之间的误差达到期望值。模型的训练包括模型参数的初始化及误差函数和精度的选择等工作。模型的训练一般是不断反复进行的,已使模型收敛于全局极小点。
(5)模型的评价和改进。合理的评估模型对非训练样本具有很好的泛化能力,即有效逼近样本蕴含的内在规律,而不是看评估模型对训练样本的拟合能力。要分析评估模型的泛化能力,应该用非训练样本误差的大小来表示和评价。BP 网络模型有很多优点,但也存在很多缺点,比如易陷入局部极小点和学习收敛速度慢等问题,为提高评估模型的泛化能力和训练效率,应对 BP 学习算法进行适当的改进。 4.2.2 模型的建立原理
神经网络模型的三要素摄信息流动方向、网络的拓扑结构和学习方式。 根据信息流向和网络的拓扑结构, 可以将神经网络模型分为前馈网络和反馈网络两大类。前馈网络的神经元分层排列, 各神经元接受前一层输入并输出到下一层, 每一层的神经元之间没有信息交流。前馈网络包括感知机和多层前馈 神经网络两种基本形式。感知机由一个输入层和一个输出层组成, 它只能解决线性可分的分类问题。多层前馈神经网络由一个输入层、若干个隐含层、一个输出层组成, 它可以用来解决非线性分类问题。反向传播(BackPropagation,BP)网络就是一种多层前馈神经网络, 是目前应用最广的一种神经网络。误差反向传播算法(Error Back-propagation Algorithm,简称HP算法)应用最为广泛, 相应的前馈网络称为BP网络。
BP网络的学习由以下四个过程组成:输入模式由输入层经隐含层向输出层的“模式顺传播”过程, 网络的期望输出与实际输出之差的误差信号由输出层经隐含层逐层修正连接权的“误差逆传播”过程, 由“模式顺传播”与“误差逆传播”的反复进行的网络“记忆训练”过程, 网络趋向收敛即网络的总体误差趋向极小值的“学习收敛“过程。
对三层BP网络, 设输入层、隐含层和输出层结点个数分别为I, J, K训练样本的个数为P, 网络的输入为XP?xpi?,期望输出为TP?tpk?,实际输出为OP?op?,输入层与隐含层的连接权为Wq,隐含层与输出层的连接权为Wkj,其中
p??1,2?,P,i?,??1?,2,?I,k,?2,激,活函数为?,?1?,KSigmoid函数
20
f?x??1,则对一个输入样本,平方误差Ep定义为:
1?c?xEp?12 (1) (t?o)?pkpk2kE?12P??(tpk?opk) (2) 2Pk 利用优化理论中的最速下降法对网络进行学习,调整各连接权,可使总体误差极小,学习公式如下:
?pwkj???pkopj ?pwji???pjopj
其中:?表示学习步长,?pk和?pj分别为:
?pk?(tpk?opk)opk(1?opk) ?pj?opj(1?opj)?(?pkwkj)
k4.2.3 样本输入选择
神经网络输入模式的正确选择对财务比率的特征抽取和网络的泛化能力有重要的影响。由于Altman比率在学习研究和实际工作中广泛使用,它能反映企业流动性、盈利性、增长性、偿债性等方面指标,因此本模型选择Altman的财务比率作为输入模式,具体指标如下:
Xp1——营运资本/总资产(Working Capital/Total Assets,WC/TA)。 WC/TA是公司净流动资产相对于总资本的一种衡量, 其中WC是公司流动资产与流动负债之差。
Xp2——留 存 收 益/总 资 产 (Retained Earnings/TotalAssets, RE/TA)。 RE/TA是公司盈利累积性的一种衡量, 它同时考虑了公司的存续时间。
Before Interest andTaxes/TotalAssets, Xp3——息税前利润/总资产(Earnings
EHIT/TA)。EBIT/TA是衡量除去税收或其他杠杆外, 公司资产的真实获利能力。
Xp4——权 益 的 账 面 价 值/总 债 务 的 账 面 价 值 (BookValue of Equity/BookValue of Total Debts, BVE/BVTD)。BVEIBVTD能够说明在公司资不抵债前, 公司资产能够下降多少。
21