银行异常交易识别的决策树及其改进算法应用研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:chengyihan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着金融业发展,利用商业银行业务进行非法交易的行为也越发猖獗,在大量的交易数据中识别异常交易账号已经成为商业银行维护正常金融秩序的重要工作之一。目前商业银行识别异常交易数据的方法是相关从业人员根据历史业务经验,人工制定识别准则并人工设定识别准则参数的方法。这种识别方法的准确性和有效性容易受到相关人员的业务素质以及往期数据中的小概率事件影响,所以本文采用统计学习的方法减少识别工作中的人为影响因素。决策树模型由于其可读性和分类速度快等优势而成为一种被广泛应用于识别工作中的统计学习方法。本文的主要工作是将决策树模型应用于识别商业银行异常交易账号的工作中,全文包括以下内容:首先,由商业银行交易数据构建交易网络,交易网络中的节点和边分别对应交易数据中的交易账号和交易账号间的交易行为。以交易网络中的节点为单位,在交易网络中提取节点的结构和性质,并对节点的结构和性质进行统计,将节点的结构和性质作为生成决策树模型的特征集,将节点结构和性质的统计数据作为生成决策树的数据集。将非现场监控模式中对交易记录的识别工作转变为对交易账号的识别工作,减少识别工作中的数据量,为生成决策树模型构建特征集和数据集;其次,构建适用于本文研究背景的噪声数据识别模型,以交易账号为单位,对于交易网络中的每一个交易账号,将其所有交易记录中的噪声数据进行有效的识别并清除,优化生成决策树模型的特征集和数据集;最后,将交易网络中节点的结构和性质作为特征集,并以节点结构和性质的统计数据作为数据集。对目前的C4.5算法进行改进,使连续型特征离散划分过程中对阈值的计算更加精确,在保留大部分数据信息量的前提下减少离散划分的区间数目。以改进的C4.5算法生成识别商业银行异常交易的决策树模型,并将该决策树模型应用于识别异常交易的工作中。
其他文献
信息隐藏是一种秘密通信技术,它是将秘密信息隐藏到看上去普通的载体信息中进行传送,以避免窃听者的怀疑。因为载体本身具有一定的冗余性,所以传统的信息隐藏算法都是通过修改载体来嵌入秘密信息。虽然这些方法都实现了秘密信息的隐藏,但是在修改载体的过程中会将修改痕迹留在含密载体上,因此隐藏算法不能彻底的抵抗各种隐写分析算法的检测。为了能彻底地抵抗各种隐写分析技术的检测,提出了“无载体信息隐藏”这样一个新的概念
由于能源危机和环境问题,电解水作为一种清洁高效的制氢技术而受到越来越多的关注。电解水的整体效率取决于阳极的析氧反应(OER)。目前,具有良好的OER催化性能的贵金属Ru和Ir
深度学习是人工智能领域的一个重要的研究方向。深度学习源于生物神经网络学,通过组合低层特征形成更加抽象的高层特征,以发现数据的分布式特征表示。深度学习领域常用的栈自
随着移动通讯技术的发展,2G、3G通信已无法满足人们对于影音娱乐、数据通讯方面的需求,LTE作为第4代移动通讯标准(4G)网络,一经出现便获得了快速的普及。目前有很多国内厂家都在对4G模块的开发及应用进行大量的投入。应国内运营商要求,4G模块需要向下兼容3G与2G网络。此外,由于4G模块通常被集成在车载、手持、穿戴、电力、安防等领域的设备上,有时还需要支持GNSS系统。4G模块的硬件设计涉及到电路
审计质量是衡量财务会计信息质量的重要指标,审计师在审计过程中往往会受到管理层的影响。一方面管理层可能会对审计师的独立性产生干扰;另一方面管理层的盈余管理行为也会影
在互联网中,企业或组织会通过收费或限制免费的方式在网站中开放自己的技术和应用供网上的潜在客户使用,但出于成本考虑和稳定性以及个性化产品迭代等需求,需要创造属于自己的服务,于是模型逼近和模拟的需求便应运而生,模型逼近和模拟即使用智能算法来逼近网络中的黑盒模型,最终复现该模型的功能。深度强化学习近年来是研究的热点,大量学者将其运用在游戏、视频等机器视觉领域中,并在各人类的策略竞技中取得了不菲的成绩,可
随着半导体工艺的飞速发展,集成电路的集成度越来越高。为了解决集成电路设计中设计周期、成本以及风险等问题,知识产权芯核IP(Intellectual Property)复用技术广泛应用于各
陆地生态系统对全球气候变化响应存在明显的区域差异性和时空敏感性。秦岭为中国南北地理分界线,位于暖温带与亚热带交界处,全年气候四季分明,降雨集中,探究秦岭植被对干湿变
在供给侧结构性改革和创新转型发展关键时期,研发创新作为提升企业核心竞争力乃至综合国力的基础,成为实现中国经济升级版的关键所在。“十三五”规划(2016-2020年)亦明确提
不同的管理层对企业信息流的管理不同,而且关于企业隐藏坏消息是当前财务研究的火热话题。为了获得职业发展或私人利益,公司的管理层有理由管理公司的信息流,以影响市场对公司未来发展和个人能力的判断。基于委托-代理理论,信息不对称理论和高阶梯队理论的理论基础,依托CSMAR数据库,选择2010-2017年中国A股上市公司的相关数据,建立模型。主要研究管理层的不同特征对企业坏消息隐藏的影响,并在此基础上把全部