ATM机交易异常的特征参数描述

来源 :科技风 | 被引量 : 0次 | 上传用户:zhuyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文主要研究了基于拓扑网络结构图的ATM系统的故障应对机制问题,采用回归分析法以及聚类分析法,构建CPU载荷(和响应时间、交易量成正比)以及预测的交易量作为两个新的特征参数。构建成功率和响应时间的中心聚类模型,挑选出分行侧网络出现故障及数据中心后端处理系统应用进程异常数据点;运用箱线图得出响应时间正常范围的阈值,建立后端CPU负荷模型;最后利用滑动时间窗口模型剔除时间窗口过小的异常数据点,指出了某年1~4月的10次异常情况。
  关键词:回归分析;聚类分析;滑动时间窗口;时间序列模型;朴素贝叶斯分类器
  1 问题背景
  银行的ATM应用系统包括前端和后端两个部分。银行总行数据中心监控系统通过汇总统计每家分行的业务量、交易成功率、交易响应时间,来做出数据分析,从而捕捉整个前端和后端整体应用系统运行情况以及时发现异常或故障。
  常见的故障场景包括但不限于如下情形:1)分行侧网络传输节点故障,前端交易异常,导致业务量陡降;2)分行侧参数数据变更或者配置错误,前端交易异常,影响交易成功率指标;3)数据中心后端处理系统异常(如操作系统CPU负荷过大),影响交易响应时间指标;4)数据中心后端处理系统应用进程异常,导致交易失败或响应缓慢。
  本文根据某商业银行ATM应用系统某分行的交易统计数据,建立模型对ATM机交易状的特征参数进行了选择、提取和分析。
  2 问题分析
  要求确定特征参数,通过观察和分析数据,发现在选择特征参数时,不能够只是简单的选择题中所给交易量,成功率,响应时间单一分析,还应该寻找他们与时间之间的关系或彼此之间的关系。通过分析后,得出综合的特征参数。
  3 基于业务量的回归模型
  通过分析,结合图中与生活中的实际情况,一月份由于过年,交易量整月增加。二、三、四月的总交易量大致相同。因而将二、三、四月共同分析,一月单独分析。同时因为工作日和非工作日交易量差异量较大,所以将工作日与非工作日分开处理。
  ● 00:00~06:00
  首先分别分析二、三、四月工作日00:00~06:00交易量与时间的关系,通过观察两者之间的散点图,可猜测两者成二次或三次曲线模型。
  经过拟合发现,三次曲线模型的R2更大,拟合度更好,因此选择三次曲线模型。
  由此可以写出三次曲线方程为:
  y=-9.931×10-7x3+0.002x2-0.689x+84.758
  同理可得,二、三、四月非工作日00:00~06:00交易量也满足三次曲线模型。由此可以写出三次曲线方程为:
  y=-1.219×10-6x3+0.002x2-0.764x+93.781
  ● 06:00~12:00
  由此可以写出三次曲线方程为:
  y=-1.065×10-5x3+12.560x-4170.905
  同理可得,二、三、四月非工作日06:00-12:00交易量也满足三次曲线模型为:
  y=-9.884×10-6x3+11.946x-4022.602
  ● 12:00~00:00
  最后,分別分析二、三、四月工作日12:00~00:00交易量与时间的关系,通过观察两者之间的散点图,可猜测两者成二次或三次曲线模型。
  由此可以写出二次曲线方程为:
  y=-0.005x2+8.874x-2982.018
  同理可得,二、三、四月非工作日00:00~24:00交易量也满足二次曲线模型为:
  y=-0.004x2+7.759x-2530.101
  4 模型检验
  综合上述情况,当时间为x交易量为y且为工作日时时,满足如下关系:
  y=-9.931×10-7x3+0.002x2-0.689x+84.758, 00:00-06:00-1.065×10-5x3+12.560x-4170.905,06:00-12:00-0.005x2+8.874x-2982.018,12:00-24:00
  当时间为x交易量为y且为非工作日时时,满足如下关系:
  y=-1.219×10-6x3+0.002x2-0.764x+93.781, 00:00-06:00-9.884×10-6x3+11.946x-4022.602,06:00-12:00-0.004x2+7.759x-2530.101,12:00-24:00
  一月份交易量随时间的变化形式和二、三、四月相似,交易量整体增加。可类比二、三、四月写出相关函数,并筛选出异常点。
  通过对数据的分析,在所有的131013组数据中,有67组异常数据符合该点处交易量陡降的特征,属于第1种异常的情况。如每天的凌晨时段,同时也应该排除一些极为离散的异常值。
  在对排除过的异常数据做进一步分析后,选取随时间连续下降的几段交易量,作为告警指标。一、二、三、四月中因交易量异常而告警的情况如下:
  1月23日19:32~19:36
  1月25日16:58~17:03
  5 模型的评价
  (1)由于综合应用多种方法提取特征,所以模型具有代表性,结合所给的数据发现,能够较好的反应ATM系统交易特征。
  (2)数据处理规范。建模时按照科学的方法对数据进行了预处理,使的模型更加精准。
  同时也可以应用于研究经济方面的股票的波浪变化问题以及一些期货公司所遇到的财务困境问题。在基于时间窗口的情况下,可以对相关数据进行挖掘来建立模型,对可能发生的问题进行告警。
  参考文献:
  [1]刘畅.城市商业银行ATM监控管理系统的设计与开发.电子科技大学,2012.
  [2]蒋良孝.朴素贝叶斯分类器及其改进算法研究.武汉:中国地质大学,2009.
  [3]段晶.朴素贝叶斯分类及其应用研究.大连海事大学,2011.
  [4]卓金武,周英.量化投资:数据挖掘技术与实践(MATLAB版).电子工业出版社,2015.
  作者简历:王嫔(1982-),女,汉族,湖南浏阳人,现为川庆钻探工程有限公司长庆钻井总公司信息与档案管理中心计算机应用工程师,研究方向:软件开发与维护。
其他文献
目的研究对甲状腺良性肿瘤手术患者实施临床路径护理的效果。方法 90例甲状腺良性肿瘤并行手术治疗的患者,随机分为观察组与对照组,各45例,对照组患者进行常规护理,观察组进
首届《洛阳市志》(18卷、1100万字)于2002年11月全部出版问世,洛阳市首届修志工作即告结束。《洛阳市志》的出版发行对积累保存地方文献,全面反映洛阳市情,促进两个文明建设发挥
洛阳古代邮驿通信历史悠久,在中国甚至世界邮驿史上都占据着十分重要的地位。延至近代兴起的邮电通信,经过建国40余年的发展,在豫西地区,已逐步形成了以洛阳为中心,沟通全市城乡、
洛阳地处“九州腹地”,号为“天下之中”,北滨黄河,南望伊阙,伊、洛、瀍、涧蜿蜒其间。在古代,这里水陆相济,舟车辐辏,商贾云集,曾长期作为全国交通中枢,对诸多朝代的建立和定都以及军
洛阳无疑是中国名城中引人注目的一座城市。历史上长期处于国都地位的洛阳,作为政治、经济、文化的中心,星转斗移,兴衰沉浮,沧桑难如人愿。
自主性创新学习是研究性学习的具体体现,而研究性学习是我校正在实施的重要研究课题之一。它符合《英语课程标准》(实验稿)的要求,即英语课程教学的根本任务是为学生的终身学
汇集十三朝古都洛阳钱币精华的《洛阳泉志》正式出版、发行以后,在社科界尤其是钱币学界引起广泛反响。许多专家学者或撰文,或致函,对该志予以高度评价及热情推介。《洛阳泉志》
在当今这个网络信息化的时代,由于电子信息技术的飞快发展,使得网络深入到了社会的各个方面。而伴随着网络技术成为现代教育技术的主要方式,各个高校的校园网络安全问题也成为了