廖
绚,李兴绪
(云南财经大学统计与数学学院,昆明650221)
摘要:由于我国没有建立完整的个人信贷信用评分制度,用传统的风险评价方法进行个人信
贷风险管理评估很难达到满意的效果。在预测是否还款的二分性结果上,Logistic是一种准确性较高的技术。文章依据银行授信5P原则及其他因素,利用Logistic模型,对各个因素与违约之间的相关程度进行了实证分析,并对银行信贷风险进行了评估。
关键词:信贷风险;个人信用评分;Logistic回归中图分类号:F832.4
文献标识码:A
文章编号:1002-6487(2008)21-0050-03
从我国银行业的实践来看,信用评分系统的应用还处于摸索阶段。由于缺乏有效的历史数据,我国商业银行普遍没有建立起定量信用评分的模型。为了降低信贷风险评估中的主观因素,越来越多的定量评估方法被采用,Logistic回归方法是预测信贷风险大小的一种常用方法。在预测是否还款的二分性结果上,Logistic是一种准确性较高的技术。本文依据银行授信5P原则及其他因素,利用Logistic模型,对各个因素与违约之间的相关程度予以实证分析,评价银行信贷风
险,以得出合理的量化评价结果作为风险决策的依据。
1Logistic回归模型Logit回归中的因变量是一个{0,1}的二分类变量。个人
信贷违约风险是由案件属性这一变量来表示的,客户还款为
1,客户违约不还款为0。即因变量Yi∈{1,0},Yi=0表示第i
个客户违约;Yi=1表示第i个客户不违约。利用Logit回归模
可见,经过新产品开发风险因素诊断,对该汽车制造企业新产品开发风险影响最大的风险因素是研发人员。因此,该企业应当以引进研发技术人才、提高研发人员新产品开发能力作为风险管理的首要任务。
参考文献:
[1]罗伯特·G·库柏.新产品开发流程管理[M].北京:机械工业出版社,2003.
[2]JimmeA.Keizer&JohannesI.M.Halman.DiagnosingRiskinRadicalInnovationProjects[J].Research-TechnologyManagement,2007,(9)~(10).
[3]陈弘.企业新产品开发风险及其评估模型[J].系统工程,2006,(7).[4]苏越良,刘勇.基于ANP网络化制造环境中的技术创新风险评价[J].科技管理研究,2006,(9).
[5]段秉乾,王安宇,司春林.复杂产品创新风险综合评估模型及其应用研究[J].科技导报,2007,(11).
3结论新产品开发是企业创新的主要内容,也是风险管理的重
要组成部分。在资源条件有限的情况下,企业必须首先通过风险诊断找到自身风险控制的重要影响因素,进行有针对性的控制和改善,以便在付出成本一定的条件下最有效地改善企业整体风险管理水平。本文提出一种利用历史数据对企业新产品开发中的风险因素进行诊断的方法,通过一种多因素条件下单因素影响的隶属概率算法诊断出其中最具影响力的关键风险因素,从而使企业能够更合理地配置资源,并采取更有针对性的风险策略。
相较于通过专家打分等方法,本文所提出的风险因素诊断方法主要依靠企业新产品开发的经验数据进行风险识别和评价,因而更具客观性。但这同时也要求企业建立历史风险数据的保存和处理机制,进行持续的风险管理和跟踪控制,其中,建立风险数据库无疑是各项风险管理工作的基础。
[6]王立新,李勇,任荣明.基于灰色多层次方法的企业技术创新风险评估研究[J].系统工程理论与实践,2006,(7).
[7]黄继鸿,柯孔林.基于集值统计的技术创新风险度量及其预警[J].科学学研究,2005,(4).
[8]A.L.Page.PDMANewProductDevelopmentSurvey:Perfor-manceandbestPractices[J].PaperPresentedatPDMAConfer-ence,Chicago,1991,(13).
[9]Hise,RichardT,Groth,JohnC.AssessingtheRisksNewProd-uctsFace[J].ResearchTechnologyManagement,Jul/Aug,1995,38(4).
[10]汪新凡.基于联系数的企业技术创新风险评价模型及应用[J].技
术与创新管理,2007,28(2).
[11]徐礼伯.房地产经营风险管理[J].江苏市场经济,2002,(1).
(责任编辑/易永生)
50统计与决策2008年第21期(总第273期)
型可以用来判断一个客户是否偿还贷款,其公式可以表达如
T
),其中,为维向量,为为:P(Y=1/X)=exp(β0+βXXpβpT1+exp(β0+βX)
赞j的为极大似然估计,而相应的条件由上面的式子得出β
赞i,这个值是指在给定的Xi的条件下Yi=1概率的估计值为P
的概率估计,代表了Logit回归模型的拟合值或预测值。
维待求的系数。
在个人信贷风险管理评估中,个案违约属性均为0或
1,但样本中没有大量的群组或重复观测数据,因此无法求得赞i),不能使用群组Logit模型的一个还款概率的良好估计值(P
估计方法。这种情况下OLS和加权最小二乘法都是无能为力的。对于这种非群组或个体数据的Logit模型,需要使用极大似然估计法进行求解。
设从总体中随机抽取n个案例作为样本,分别表示为
22.1
实证分析数据收集及变量的定义
在搜集样本时,一方面希望选取的样本对未来的申请人
总体具有较好的代表性;另一方面希望收集的样本中包含了各种不同的信用行为的客户,从而能够识别哪些因素对客户的信用行为产生影响。本文对云南省某县的三家银行进行数据的收集和整理,确定了104个样本,其中部分数据有缺失值的样本有10个,故有效样本为94个。
其中正常案件有
Y1,Y2,…,Yn,设Pi=P(Yi=1/Xi)为在给定的Xi条件下,Yi=1的
概率。同理可得,Yi=0的概率可以表示为:P(Yi=0/Xi)=1-Pi。
两者的概率均可以表示为:P(Yi)=Pi(1-Pi)
Y1-Y,其中,Yi=1
63起,违约案件有31起(见表1)。
表1
项目正常案件违约案件合计
样本资料总表
全部样本数
有效样本数
百分比(%)
或Yi=0(i=1,2,…,n)。因为各项观测相互独立,其充分必要条件就是其联合概率分布(设为L(θ))等于各边际分布的乘积:L(θ)=
n
i=1
仪P
Yi
(1-Pi)
1-Y,L(θ)为n个观测的似然函数。对确
6539104
63319496.9279.4990.38
定的Yi来说,它是β0和βi(i=1,2,…,p)的函数,即
Pi=eβ+βX1+e
0
β0+βX+βx+…+βX个人信贷评估模型是利用贷款人的历史数据及定量方法,根据贷款申请人的不同特征变量,对申请人还款和违约的行为进行分析。用于区分好客户和坏客户的特征变量主要有两种来源:第一来源于申请人填写的申请表格;第二来源于借款人某个帐户的交易行为的变量。考虑数据的可得性再结合国外普遍采用的5P原则,本文选取具有代表性的9个指标,并且对其进行分类、赋值。指标体系分述如表2。
+βX+…+βX目的是求出的参数估计量使L(θ)最大。使L(θ)最大化非常困难,所以选择使1n[L(θ)]最大,因为1n[L(θ)]和L(θ)是单调函数,当1n[L(θ)]取最大值时,L(θ)也同时取得了最大值。根据Logit函数,可以得到公式:
β0+βX+βx+…+βX0
Pi=P(Yi=1/Xi)=eβ+βX1+e
n
Y+βX+…+βX2.2建立Logit模型
经过资料转换,将原始数据进行赋值处理后用SPSS软件
1n[L(θ)]=1n[仪Pi(1-Pi)
i=1
n
1-Y]
进行Logit回归分析,采用向前逐步回归法,对9个解释变量以向前(forward)逐步回归法挑选显著的自变量,将其纳入模型中。结果得到职业X2、年总收入X3、贷款金额X4、还款期限
=Σ[Yi1n(Pi)+(1-Yi)1n(1-Pi)]
i=1n
X5、还款人X6、担保人X8等6个解释变量在0.05的显著水平
下显著。
结果得到职业X2、年总收入X3、贷款金额X4、还款期限
=Σ[Yi1n(Pi)+1n(1-Pi)]
1-Pii=1
=Σ[Yi(β0+ΣβjXij)+1n(1-i=1
j=1
n
p
exp(β0+ΣβjXij)1+exp(β0+ΣβjXij)
j=1pj=1
p
p
X5、还款人X6、担保人X86个解释变量在0.05的显著水平下
)]
显著,参数估计结果解释如下:职业达到0.05的显著水平且职业取值越大还款机率越大,即一般职员的违约风险大于个
表2变量
指标
案件属性还款为1;违约不还款为0年龄职业年总收入贷款金额还款期限还款人担保品担保人信贷记录
指标分述
赋值
=Σ[Yi(β0+ΣβjXij)-1n(1+exp(β0+ΣβjXij))]
i=1
j=1
j=1
np
上式称为似然对数函数。为了求得系数使L(θ)最大,分别对βi(i=1,2,…,p)求偏导数,并令其为零,如:
p
YX1X2
坠1n[L(θ)]=(Yi-Σ坠β0i=1
n
exp(β0+ΣβjXij)1+exp(β0+ΣβjXij)
j=1p
j=1
p)=0
X3X4X5X6X7X8X9
坠1n[L(θ)]=(Y-Σi
坠β0i=1
n
exp(β0+ΣβjXij)1+exp(β0+ΣβjXij)
j=1j=1
p)Xij=0(j=1,2,…,p)
30岁以下(包括30岁)为1;30岁以上,50岁以下为2;50岁以上(包括50岁)为3
职员为1;公务员为2;个体户为3;管理人员为4;其他为5
3万元以下(包括3万)为1;3万元以上,10万元以下(包括10万)为2;10万元以上,30万元以下(包括30万)为3;30万元以上为4
10万元以下(包括10万)为1;10万元以上,20万元以下(包括20万)为2;20万元以上,50万元以下(包括50万)为3;50万元以上为410年以下为1;10年为2;10年以上为3有共同还款人为1;没有共同还款人为0
以土地或土地及建筑物担保为1;其他担保品为0有担保人为1;没有担保人为0
信用等级为A或A以上为1;其他为0
统计与决策2008年第21期(总第273期)
51
体户、管理人员等。职业种类不同,工作安定性、流动性与薪金报酬就具有差异性,偿还贷款能力也因此存在差异。
年总收入与还款机率在0.01的显著水平下呈正相关,说明年总收入与还款有密切关系,年总收入越高,经济能力越强,越不容易违约。
贷款金额在0.05的显著水平下与是否还款呈负相关。贷款金额是影响还款与否的显著变量之一;也就是当贷款金额越大时,越容易违约。因此就消费者贷款而言,贷款金额是影响还款与否的显著变量。
还款期限能到达0.01显著水平,且贷款期限越长越不容易违约。现在消费者多采用分期付款方式,期限越长,本金稀释效果越大,每期平均摊还的金额就会较少,偿债压力就相对较小。因此一般认为长期贷款还款机率高于短期贷款。
还款人,即是否有共同还款人,这一解释变量达到0.05的显著水平,且表明有共同还款人的违约风险小于没有共同还款人。此情况合乎常理,若有共同还款人,则保障了还款来源,当借款人收入不足以偿清贷款时,共同还款人可以帮助还款。
担保人在0.01的显著水平下显著,有担保人比较不容易违约。担保人制度的目的在于加强或补充借款人条件的不足;担保人对债务所负的责任是连带责任,与借款人相同,且担保人多是借款人的亲人,能给予借款人一定程度的还款督促。因此在现阶段,担保人制度仍是有必要的。
将参数估计结果整理为:
通过模型的建立与实证分析,在选择的9个自变量中,有职业、年总收入、贷款金额、还款期限、还款人、担保人6个解释变量能达到0.05显著水平,对还款与否有显著影响,这对银行承做授信业务具有一定的参考价值。年龄、担保品与信贷记录没有进入模型,这一结论值得银行重新考虑担保品与信贷记录对最终授信与否的影响程度。从担保品的有无来看,银行传统上授信贷款,都会要求借款人提供适当的担保品,以确保债权安全,但担保品不能降低借款者本身风险,从而不能提高放款契约安全性,因此担保品对于债权保障功能有减弱的趋势,银行可能要重新考虑,不宜再视担保品的有无为必要条件。对于信贷记录,是否信用等级较高与授信品质没有显著关系存在。银行不应对信用等级高的借款人就放松警觉,不宜将过去的信贷记录作为重要的考虑依据,且不宜放松对有信贷记录者的审核。
就模型分类预测结果而言,正确预测的正常案件比例为果见表3。
由表3可以看到,随着逐步回归的进行,预测准确率是逐渐提高的。在最后一步回归中,没有偿还贷款的31组案例,24起被判违约,7起被误判不违约,正确率是77.4%;在还款的63组案例中,59起被判不违约,只有4起被判违约,正确率是93.7%。总体的预测准确率达到88.3%,说明最终得到的模型预测效果较好,是有意义的。
3结论L1=1n(
pi)=-8.682+0.754X+1.576X-0.955X+
234
1-pi
1.794X5+2.429X6+3.144X8
举例来说,再经处理后的数据表中任意选取一个样本数据,其各变量的取值分为:X2=2,X3=2,X4=1,X5=1,X6=1,X8=1,将它们带入上述模型,计算得1n(pi
)=2.390,pi
93.7%,违约案件正确预测比例为77.4%,模型总正确率为88.3%,说明模型具有一定参考价值。但需要注意的是,正常
案例的误判不会带给银行较大的损失;而违约案例误判的损失却是很大的。违约案例的预测正确率对银行更为重要。
本次研究由于数据采集有一定的局限性,仅在云南省某县的三家银行收集了104个样本,样本容量小,模型的代表性较差,在实践应用中受到一些限制与制约;但可以运用此方法建立地区之间、银行之间具有可比性、广泛性的个人信贷风险评估体系,其应用前景将十分广阔。
预测
案件属性
正确率
1-pi1-pi
=e2.39=
10.913,pi=0.9161,即还款概率为91.61%。2.3
模型检验
通过向前逐步回归,SPSS得到对应变量的分类预测结
表3
观测样本
分类预测结果
步骤1案件属性预测准确率
010101010101
02726163205226236244
143715601158957857759
参考文献:
步骤2案件属性预测准确率
步骤3案件属性预测准确率
步骤4案件属性预测准确率
步骤5案件属性预测准确率
步骤6案件属性预测准确率
87.158.768.151.695.280.964.592.183.071.090.584.074.290.585.177.493.788.3
[1]TorJacobson,KasperRoszbach.BankLendingPolicy,CreditScoringandValue-at-Risk2003.
[2]中国工商银行江苏省分行课题组.当前我国商业银行面临的主要操作风险及对策研究[J].金融论坛,2005,(4).
[J].JournalofBanking&Finance,
[3]田玲,蔡秋杰.中国商业银行操作风险度量模型的选择与应用[J].中国软科学,2003,(8).
[4]王济川,郭志刚.Logistic回归模型-方法与应用[M].北京:高等教育出版社,2001.
——Logit[5]陈家彬,赖怡洵.台湾地区银行放款有无担保之决定因素—模型之实证分析[J].管理评论,2001,(1).
(责任编辑/易永生)
52统计与决策2008年第21期(总第273期)
因篇幅问题不能全部显示,请点此查看更多更全内容