基于数据挖掘的金融风险预警

来源 :知识与创新 | 被引量 : 0次 | 上传用户:QINSHAOKUN1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:金融风险预警是金融数据挖掘中的一个重要研究方向,运用数据挖掘技术从海量的金融数据中发现隐藏在其背后的规律,能够有效地降低金融机构的运营风险,因此金融风险预警有着广阔的应用价值和市场前景。文章运用基于聚类分析和神经网络的的数据挖掘技术,研究金融风险评价指标体系,建立风险预警模型,研究结果表明,构建的预警模型能够较好地描述我国金融风险变化的区制状态,其预警結果符合我国现实情况。
  关键词:数据挖掘 金融风险
  
  在经济全球化背景下,我国潜在的金融风险日益增大,研究金融风险评价指标与预警问题对我国防范和化解金融风险有着重大的现实意义。目前已经有一些进行实证或者数量的金融风险研究,如Kaminsky等人的“信号法”(简称KLR法);Frankel等人的概率单位模型(简称FR法);Sachs、Tomell&Velasco等人的横截面回归模型(简称STV法)。这些预警方法在国内外应用广泛,但均有其共同的不足:主观性较强,缺乏非线性处理机制,缺乏全局观念。为了避免上述方法的局限性,本文运用聚类分析和人工神经网络相结合的方法对金融危机进行预警。
  数据挖掘是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,具有不需要依靠假设条件、能够处理大规模数据等优点。数据挖掘技术应用到金融领域,对金融市场进行析、建模和预测,并进行风险评估和客户关系管理,为金融企业运营提供决策支持,并具有一定的预警作用。
  一、金融风险评价指标体系
  我们把金融风险基本态势划分为金融安全、金融基本安全、金融警惕和金融危机四种情况。同时,分别为金融风险的四种基本态势赋予不同的分值范围,分值越高,说明金融稳定状况越好,分值越低,说明金融风险越大,金融稳定状况越差(见表1)。
  表1 金融风险基本态势划分
  S值 安全状况 风险状况 金融运行状况
  80≤S<100 金融安全 无明显风险 各项风险指标均住安全区内;金融市场稳定,金融运行有序,金融监管有效,金融业稳健发展
  50≤S<80 金融基本安全 轻度风险 各项风险指标均住安全区内;金融市场稳定,金融运行有序,金融监管有效,金融业稳健发展
  20≤S<50 金融警惕 严重风险 大部分金融指标恶化;大多数金融机构有不同程度的不良资产问题;有较多的金融机构倒闭;货币较大幅度贬值;金融动荡、经济衰退
  S<20 金融危机 风险总爆发 金融不安全状况累积的结果,爆发严重的货币危机和银行危机,货币大幅度贬值、大批金融机构倒闭;金融崩溃、经济衰退、社会动荡
  
  金融预警模型迄今基本上采用指标预测法。其基本方法是:首先选择若干次金融危机样本,对每个金融危机样本,选择一套指标体系,选取一个观察期,然后考察样本个体的各项指标在各自观察期的运动趋势,最后结合多次金融危机的样本,概况出所有样本个体各项指标的运动规律,运用这些普适的运动规律作为预警依据,以达到预测金融危机的目的。
  依据《新巴塞尔协议》等国际通用标准,中国人民银行资产负债管理指标,以及风险管理经验确定,本文选择以下指标作为我国金融风险的监测指标,并对建立的指标体系中的各指标的临界值区间进行了划分(见表2)。
  表2 金融风险预警指标体系各指标临界值划分
   一级
  指标 二级
  指标 风险状态
   安全 基本安全 警惕 危险
  金
  融
  风
  险
  评
  价
  指
  标
  体
  系 经济增长风险指标 GDP增长率S1 >12 8-12 4-8 <4
   固定资产投资增长率S2 13-19 10-13或19-22 7-10或22-25 <7或
  >25
   财政风
  险指标 财政债务依存度S3 <20 20-35 35-50 >50
   国债负担率S4 <15 15-20 20-25 >25
   政收入占GDP的比重S5 >24 20-24 15-20 <15
   货币风
  险指标 通货膨胀率S6 <3 3-6 6-9 >9
   M2增长率/GDP增长率S7 <2 2-2.5 2.5-3 >3
   信贷增长率/GDP增长率S8 <1.5 1.5-2.2 2.2-3 >3
   国际收支风险指标 经常项目差额/GDPS9 0-3 3-4.5 4.5-5 <0或>5
   短期外债/外债总额S10 <15 15-25 25-35 >35
   外汇储备/年进口总额S11 >50 30-40 20-30 <20
   外债负债率S12 <15 15-25 25-40 >40
   外债偿债率S13 <10 10-20 20-40 >40
   外债债务率S14 <60 60-80 80-100 >100
   股市泡沫风险指标 股票市盈率S15 <40 40-60 60-80 >80
   股票市价总值/GDP(S16) <30 30-60 60-90 >90
   银行风
  险指标 资本允足率S17 >12 8-12 4-8 <4
   不良贷款率S18 <12 12-17 17-22 >22
   存贷款比例S19 <60 60-75 75-85 >85
   中长期贷款比例S20 <10 10-15 15-20 >20
  
  二、金融风险预警模型的建立
  预警模型先采用模糊C聚类算法对输入的历史数据进行分类,然后针对不同类型的数据,采用增加动量项的BP神经网络训练出不同的模型,最后对新输入的先判断其属于哪一类,然后输入对应于该类一训练好的模型,得出预测结果。由于同类数据具有更多的相似特征,所以在准备性上优于传统的BP神经网络模型;而且对于每一类来说,由于训练样本少,而且样本相似度较高,训练对应的模型训练的时间代价和复杂度都大大降低了,同时还可以有效检测出异常点。
  (一)模糊聚类原理
  FCM算法是一种能自动对数据样本进行分类的方法,它通过优化目标函数得到每个样本点对类中心的隶属度,从而决定样本点的归属。该算法是一种划分算法,目标是使各个分类中的样本到聚类中心的加权距离平方和达到最小。
  定义FCM的价值函数(或目标函数)的一般化形式:
  
  uij介于[0,1]间,且,ci为模糊组I的聚类中心,dij=||ci-xj||为第i个聚类中心与第j个数据点间的欧几里德距离,且m∈[1,∞)是一个加权指数。
  利用条件极值方法,构造如下新的目标函数:
  
  
  其中,λj,j=1,2,…,n均为拉格朗日乘子。对所有输入参量求导,使式(1)达到最小的必要条件为:
  
  
  由上述两个必要条件,模糊C均值聚类算法是一个简单的迭代过程。在批处理方式运行时,FCM用下列步骤确定聚类中心ci和隶属矩阵U:
  步骤1:用值在[0,1]间的随机数初始化隶属矩阵U,使其满足式(1)中的约束条件。
  步骤2:用式(3)计算c个聚类中心ci,i=1,…,c。
  步骤3:根据式(1)计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阀值,则算法停止。
  步骤4:用式(4)计算新的U矩阵。返回步骤2。
  上述算法也可以先初始化聚类中心,然后再执行迭代过程。由于不能确保FCM收敛于一个最优解,算法的性能依赖于初始聚类中心。因此,我们要么用另外的快速算法确定初始聚类中心,要么每次用不同的初始聚类中心启动该算法,多次运行FCM。
  (二)神经网络原理
  本文运用改进的神经网络模型对进入风险预警模型进行学习训练,其一般构建步骤是:输入的选择;输出的选择;隐层神经元节点数的选择;网络的学习算法。
  为了加快BP网络算法和使收敛过程稳定,Rumelhart、Hinton和Willans在计算ΔWij,k(t-1)的公式中加入一个惯性量:ΔWij,k(t)=ηtσi,kVj,k-1(t)+αΔWij,k(t-1)。
  式中,η为学习率,α为动量因子,t为迭代次数,Wij,k表示k-1层第j单元到k层第i单元的连接权重,Vj,k-1(t)表示第k-1层第j神经元的输出σi,k为k层第i神经元的误差反传量。
  则在网络训练过程中连接权值与阈值的更新公式如下:
  对输出层、连接权值与阈值更新公式为:
  
  
  对隐含层、连接权值与阈值的更新公式为:
  
  
  附加的动量引入可使网络权值的变化不仅反映局部的梯度信息,而且反映误差曲面最近的变化趋势,同时在一定程度上可以解决局部极小问题。
  三、实证分析
  (一)数据的归一化处理
  本文以1993-2007年的指标数据为样本,其中,1993-2005年数据为训练集,2006年数据为测试集,2007年为预测集。由于各指标之间存在着方向、数量级不同等问题,为使各指标在整个系统中具有可比性,且更好地进行BP人工神经网络的训练,在建立BP神经网络之前,需要对数据进行归一化处理,转化为闭区间[0,1]上的无量纲性指标值,本文采用的归一化方法是极差标准化法。即:
  Yij=(Xij-minXi)/(maxXi-minXi)
  其中,i为第i项金融风险预警紧急指标,j为第j年度,Xij为第i项指标的第j年初始数据,Yij为i项指标的第j年归一化数据(见表3)。
  (二)FCM算法聚类
  根据FCM模糊聚类算法将所有數据划分为4个类,通过MATLAB软件实现,可得到新的隶属矩阵及聚类中心:
  
  
  
  
  
  
  
  
  
  
  由隶属矩阵U我们可以得到指标国债负担率(S4)、财政收入占GDP的比重(S5)、经常项目差额/GDP(S9)、短期外债/外债总额(S10)、资本充足率(S17)、中长期贷款比例(S20)属于第一类,指标财政债务依存度(S3)、外汇储备/年进口总额(S11)、股票市价总值/GDP(S16)、存贷款比例(S19)属于第二类,指标GDP增长率(S1)、固定资产投资增长率(S2)、通货膨胀率(S6)、股票市盈率(S15)为第三类,指标M2增长率/GDP增长率(S7)、信贷增长率/GDP增长率(S8)、外债负债率(S12)、外债偿债率(S13)、外债债务率(S14)、不良贷款率(S18)为第四类。
  (三)风险预测
  在20个预警指标,1993-2007年共15年的指标数据中,选取1993-2005年的指标数据作为训练集来训练网络,用2006年的数据作为测试集来进行检验,2007年的数据作为输入值来进行预警。选用增加动量项的BP算法对4种类别的指标分别进行训练预测。根据本文前面将金融风险预警体系区分为安全、基本安全、警戒和危险,对应地划分为4个安全区间:安全、基本安全、警戒值、危险。4种不同的风险阈值的评判标准,本文采用前面体系标准介绍中的极值——均值法,得到表4、表5、表6、表7。
  表4 第一类
   2006年
  输入 期望
  输出 实际
  输出 预测
  2008年 风险
  状态
  国债负担率(S4) 0.7100 0.9900 0.9999 1.0000 安全
  财政收入占GDP的比重(S5) 0.8400 1.0000 0.9807 0.0059 警惕
  经常项目差额/GDP(S9) 0.8800 1.0000 0.9450 0.9689 警惕
  短期外债/外债总额(S10) 0.9600 1.0000 0.9676 08384 警惕
  资本充足率(S17) 0.9300 0.9300 0.8922 0.9585 基本安全
  中长期贷款比例(S20) 0.9100 1.0000 0.9212 0.9739 警惕
  
  
  表5 第二类
   2006年
  输入 期望
  输出 实际
  输出 预测
  2008年 风险
  状态
  指标财政债务依存度(S3) 0.3500 1.0000 0.9623 0.7763 警惕
  外汇储备/年进口总额(S11) 0.8200 1.0000 0.9656 0.5473 基本安全
  股票市价总值/GDP(S16) 0.3000 1.0000 0.9062 0.7394 警惕
  存贷款比例(S19) 0 1.0000 0.8033 0.1002 基本安全
  
  
  表6 第三类
   2006年
  输入 期望
  输出 实际
  输出 预测
  2008年 风险
  状态
  GDP增长率(S1) 0.5500 0.5900 0.5790 0.4799 警惕
  固定资产投资增长率(S2) 0.3300 0.3500 0.2974 1.0000 危险
  通货膨胀率(S6) 0.1100 0.2400 0.2219 0.8763 警惕
  股票市盈率(S15) 0.3800 1.0000 0.9568 0.9899 危险
  
  表7 第四类
   2006年
  输入 期望
  输出 实际
  输出 预测
  2008年 风险
  状态
  M2增长率/GDP增长率(S7) 0.1500 0.0500 0.0487 0.0821 基本安全
  信贷增长率/GDP增长率(S8) 0.3000 0.1800 0.1671 0.5089 警惕
  外债负债率(S12) 0.1400 0 0.0003 0.5288 警惕
  外债偿债率(S13) 0.0100 0 0.0019 0.0004 危险
  外债债务率(S14) 0.0400 0 0.0422 0.1048 警惕
  不良贷款率(S18) 0.0400 0 0.0096 0.0051 危险
  
  由以上表可知,2008年的风险情况如下:国家综合金融风险Ⅳ级,即危险状态。
  第一类财政贸易风险III级,即警惕状态,有风险;与国债负担率(S4)、财政收入占GDP的比重(S5)、经常项目差额/GDP(S9)、短期外债/外债总额(S10、资本充足率(S17)、中长期贷款比例(S20)与财政风险和国际收支风险联系很高,因此称为财政贸易风险经济因子;第三类宏观经济风险III级,即警惕状态,有风险;与GDP增长率Sl、固定资产投资增长率S2、通货膨胀率S6、股票市盈率(S15)和宏观经济联系很高,定义为宏观经济因子第四类银行风险Ⅳ级,即危险状态;M2增长率/GDP增长率(S7)、信贷增长率/GDP增长率(S8)、外债负债率(S12)、外债偿债率(S13)、外债债务率(S14)、不良贷款率(S18)是银行风险因子。第二类其他风险:III级,即警惕状态,有风险,是除上述三项外的金融风险因素因子。
  四、结论
  研究结果表明,本文构建的金融风险预警模型能够很好地描述我国金融风险变化的区制状态,其预警结果符合我国现实情况。但总的来说,目前的金融危机预警模型虽能显示一个国家对危机的易感性,但对危机预警的作用仍处于试验和探索阶段。它们在研究范式、理论基础、预警模式及判断标准方面都存在很大局限性,未来的金融预警模型的发展方向即是对这些局限的突破。
  (作者单位:武汉理工大学理学院)
  
  【参考文献】
  1、Sachs,Jeffrey,Aaron Tomel l and Andres Velasco.Financial Crises in Emerging markets:The Lessons From 1995[Z].Brookings Popers on Economic Activity,1996.
  2、黎子良,邢海鹏.金融市场中的统计模型和方法[M].高等教育出版社,2009.
  3、高新波.模糊聚类分析及其应用[M].西安电子科技大学出版社,2004.
  4、韩立群.人工神经网络理论、设计及应用[M].化学工业出版社,2007.
  5、温红梅,姚凤阁,王岩伟.金融风险管理[M].东北财经大学出版社,2009.
  6、范明,孟小峰.数据挖掘概念与技术[M].机械工业出版社,2008.
其他文献
摘 要:社会发展代价问题是当今国际社会普遍关注的问题,由于中国特殊的国情,对这一问题尤为关切。改革开放以来,随着社会主义现代化建设的不断深入,中国在社会发展的各个领域取得巨大成就的同时,各种发展问题也日益凸显出来,引起人们越来越多的思考和关注。这也引起了理论界的关注,学者们围绕着这一问题发表了大量的论文和专著。由此,文章就目前理论界对中国当前社会发展代价问题的研究进行了文献综述。  关键词:社会发
期刊
理性是一种认识世界的方式,是把认识归之于明晰、确定的一系列逻辑规则,“关于理性的规则究竟是什么这一合理性前提的基本认识上,在西方科学和哲学的认识论历史上,人们几乎都自觉不自觉地把希望共同诉诸于思维逻辑,起码认为理性的主要规则是逻辑。”信仰,经常与宗教相联系,表示一种对宗教的虔诚、完全信任的态度、情感等;而更简单的来讲,信仰仅仅表示了一种坚定的、程度更强的相信和信念,这也是本文所取的信仰一词表达的意
期刊
摘 要:内部控制是随着外部竞争的加剧和内部强化管理的需要而不断丰富和发展的。国内外对内部控制的研究历史已经很久,通过对国内外内部控制研究文献的回顾,对内部控制研究现状进行评价,认为我国现在对内部控制研究的目标定位较低、内部控制研究不成体系和不系统、研究的视野不够宽广,在今后的内部控制研究过程中要需要突破这些瓶颈。  关键词:内部控制研究 文献回顾 评价    内部控制的概念源于会计控制,过去一直是
期刊
摘 要:文章是讨论罗素的一首为其妻子——伊迪丝所写的一首诗。这是一首充满激情和爱的诗。通过分析该诗的背景、内容、内涵,还解释了罗素在高龄写出如此富有激情的诗的原因,并从中了解到了他的人生观。  关键词:伯特兰罗素 爱 激情    作家伯特兰罗素(b.1872-d.1970)才华横溢,他不仅仅是一位英国哲学家,还是逻辑学家、散文家、社会批评家,他以数学逻辑和分析哲学最为著名。他最有影响力的成就是在2
期刊
摘 要:培养外语专业复合型人才是时代发展的需要, 但各高校的实际情况不同,所以在复合型人才的培养问题上应结合院校实际和本地区发展的特点。文章首先提出外语人才培养模式上存在的问题,然后结合地方经济发展的特点,从教学方法的转变和课程设计的改革入手,探讨复合型外语人才的培养途径。  关键词:复合型外语人才 教学方法的转变 课程设计 培养途径    玉林师范学院作为桂东南地区唯一的一所本科院校,坚持立足玉
期刊
摘 要:初中政治学习过程中,面对庞繁复杂的知识,采用“知识结构图”法将知识点层次清晰的呈现出来,使知识纲要化、条理化,有利于减轻学生学习负担,增强学生的思维能力,增强教师的责任心,全面提高教育质量,从而达到教学双赢的效果。  关键词:知识结构图思维能力学习效率条理化    在初中政治学习过程中,学生对学习政治知识一般较形式、离散,使得政治知识在学生的头脑中是混乱且不清晰的。如何应对错综复杂的知识点
期刊
摘 要:高职城市轨道交通控制专业课程设计必然选择课程项目化。课程项目化的设计要符合以下原则:实践性原则、相关性原则和思考性原则。  关键词:高职课程体系设计课程项目化工作体系    高职教育作为高等教育中的一个类型,其人才培养规律有其自身的特点。当前高职教育所面临的核心任务是课程体系的设计,其中,课程项目化是突出高职办学特色、促使课程体系设计走向优质的一条有效途径。课程项目化是高职城市轨道交通控制
期刊
摘 要:当前大学生德育教育已成为高校教育工作中的一项重要任务,而体育教育已成为大学教育中重要的组成部分。体育课教学因其独特的教学模式和方法,对大学生的德育教育具有不可缺少的重要作用。体育是一门以实践为主、身心同一参与的活动课程,是进行德育教育的有效手段和重要途径。体育教学中的德育培养是德育工作的补充、延续和具体化。  关键词:体育教育 德育教育    大学体育教育是学校体育教育的重要组成部分,学校
期刊
美国私立科研机构克雷格文特尔研究所研究人员在2010年5月20日发表声明,该所研究人员人工合成了一种名为蕈状支原体的细菌的脱氧核糖核酸(DNA),并将其植入另一个内部被掏空的、名为山羊支原体的细菌内。经过多次失败实验,他们最终使植入人造DNA的细菌获得新生,并开始在实验室的培养皿中繁殖。美国拉特格斯大学分子生物学家理查德埃布赖特说:“这是人与自然关系的一个转折点,历史上第一次有人创造了一个完整的带
期刊
摘 要:近年来,嵌入式系统的软、硬件开发得到了快速的发展,已经广泛应用于工业、国防、航天、医疗、家用消费类电子等行业。随着应用的复杂性和质量要求的逐渐提高,嵌入式计算机的开发已向小型化、高集成度、低功耗、软硬件相结合、简洁灵活的设计方向发展,这样就给了诸如CPLD和FPGA这样的可编程逻辑器件极大的用武之地,PLD的设计灵活性和资源丰富性不仅使得整个嵌入式系统物理空间精简紧凑,而且提高了整个系统的
期刊