基于CNN的信用卡欺诈检测

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wc420178
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信用卡交易在日常生活中越来越普遍,同时信用卡欺诈的数量也在激增。每年大量的信用卡欺诈事件都给银行和个人带来巨大的损失。传统的信用卡欺诈检测方法大部分是基于规则的专家知识系统来检测欺诈行为。一般来说,专家系统的结构相对固定,不容易泛化,只能检测出简单的欺诈模式。相比于专家知识系统来说,机器学习的模型更复杂,泛化能力更优秀并且对数据有更强的表征能力。所以机器学习方法能够有效地检测出更多的欺诈模式。越来越多的学者开始用基于统计的机器学习方法来检测信用卡欺诈。在使用机器学习方法来检测信用卡欺诈时,有许多问题和挑战需要我们面对。首先信用卡交易是一种时间序列模型,怎样提取能够有效表征信用卡交易模式的特征是欺诈检测模型要解决的重要问题。另外信用卡交易存在严重的数据不平衡问题,欺诈样本的数量远远少于正常样本,采用什么样的方法来平衡正负样本比例是提高欺诈检测准确率的关键点。我们开发了一个基于CNN的信用卡欺诈检测系统,从有标签的数据中学习欺诈行为的内在模式。我们将大量的交易数据表征成特征矩阵的形式,从而能够应用卷积神经网络来提取高阶特征。在本文的特征工程模块,我们提出了一种名为交易熵的特征。该特征能够敏锐地捕捉信用卡用户近期交易行为的变化。针对数据不平衡问题,我们采用了一种基于代价的采样方法来提高欺诈样本的比例。同时为了更好地利用大量的正常交易数据,我们采用了bagging集成方法训练出多个卷积神经网络模型并对这些模型的预测结果进行平均得到最终的欺诈评分。融合多个分类器的方法能够显著提高模型的鲁棒性。本文中大量的实验数据来源于一个商业银行的信用卡交易数据。我们使用F1-score和ROC曲线作为实验结果衡量的指标。最终实验结果表明,本文提出的算法与其他算法相比在效果上有了很大的提升。
其他文献
近年来,随着我国的科技不断成熟,互联网营销的策略也在不断发展,从21世纪初的搜索引擎营销和爆款营销,再到如今的社群营销。对于出版社来说,营销环节正变得越来越重要,尤其是
人们对音乐起源的问题探寻已久,古今中外众说纷纭.然而用历史唯物主义观点辩证地、全面地对五种有代表性的音乐起源学说进行分析,我们就会发现:各种音乐起源学说的行为活动都
目的了解痴笑性发作的临床特点及治疗。方法回顾性总结6例痴笑性发作的临床特征与抗癫痫药物治疗情况。结果 6例患者均突发突止,反复发生,发作时间短,无外界诱因,不伴任何情
加强新农村建设一直以来都是国家重点发展与着力推进的一项重要任务。在新农村建设工作中,发展农村畜牧养殖业是重要组成内容,近年来也取得显著成效,特别是农村的畜牧兽医医
编者的话:$$     6月7日理论与实践周刊“刑事·行政审判”版刊登了崔永峰的《明知被强迫卖淫而嫖宿是否构成强奸罪》一文,作者认为嫖宿者的行为只是嫖娼而不构成犯罪。6
学位
介绍新型快速堵漏剂的研制 ,包括原材料的选择、配方和工艺的确定等。该堵漏剂采用无机胶凝材料和高分子粘接材料复合而成 ,能与多种基面牢固粘接成无缝、致密稳定的整体保护
行动系统是履带车辆最基础的组成部分,是实现履带车辆高机动性、全地形通过性和轻量化的关键子系统。近年来随着大型多体动力学软件的广泛应用,针对履带车辆行动系统的动力学
高校图书馆的作用是将收集、收藏的图书提供给学生参考、借阅,但因高校图书馆的图书储存量过大,图书信息资料的类型又各有所异,读者在寻找自己想要的信息资料时怎样可以更加
目前,中国的软件企业正处于高速发展的状态,需要以项目环境为主导的规范的软件项目管理。从概念上讲,软件项目管理是根据管理科学的理论,结合软件产品开发的实际,保证工程化
综述了纳米材料改性水性聚氨酯(PU)研制的进展情况,介绍了纳米材料在水性PU乳液中的分散方法和水性PU纳米复合材料的制备方法,并对纳米技术在水性PU中的发展应用作了展望。