基于分类技术的电子支付平台作弊财户的识别模型研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zhangtao870508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子支付平台交易量、虚拟货币的发行和流通量越来越大,涉及的账户越来越多,导致沉淀资金、洗钱、套现、作弊等信用问题愈加突出,已逐渐成为制约电子商务发展的最大瓶颈。由于信用违约的行为形式多样,技术手段高明而隐蔽,具有很大的差异性和与时俱进。目前电子支付公司采用一系列的安全产品更多的是防范,而缺少主动出击,单靠经验和人工审核办法还很难以捕捉。因此,电子支付公司需要加强技术,主动有效地防范和化解信用风险,提高企业信用甄别与风险管理的水平和能力。   本文从“作弊用户希望用较少的钱、短时间把信誉提高”的心理角度考虑,给出了作弊账户定义,并对作弊账户和正常账户相比更具有批量注册、交易金额非常低、交易的时间非常集中等特点。   针对作弊帐户识别问题,Lach(1999)指出可以利用数据挖掘中基于ID3和C4.5的树分类技术识别和理解的作弊行为模式,定位高作弊嫌疑的账户,缩小范围后再通过人工审核,从而较精确捕捉到作弊账户。并基于一电子商务公司作弊的简单实例数据,利用树算法ID3(Mitchell,1997)和C4.5(Quinlan,1993),建立识别模型。虽然ID3和C4.5算法对训练样本集的学习中尽可能多地挖掘信息,但生成树分枝较多,规模较大。为了简化树算法,提高效率,又出现了根据GINI系数作为分裂规则的CART算法,其结构简单、易于理解的二叉树。再考虑到现实中的数据质量问题,鉴于树算法对孤立点有免疫力和自动处理缺失数据的优点,所以选择CART树算法作为主要建模工具。另外,单一CART树会具有不稳定性的缺点,可以通过组合技术,提高稳定性和精度,所以便有了多树的TreeNet算法(Friedman,2002)。   本文以电子支付平台数据集作为实例,把作弊账户和正常账户进行对比分析,基于逻辑回归、CART和TreeNet算法建立识别模型,通过在验证数据集上比较,发现属于非参数方法的CART和TreeNet算法好于属于参数方法的逻辑回归算法,多树TreeNet模型在性能上好于单一树CART模型,但模型解释性没有这么好。考虑到系统的实现和业务解读,通常在不牺牲精度的情况会优先选择CART模型。   最终模型的结果可以翻译成通用语言(比如C和JAVA语言),整合到营销平台和相应的分析报告中,以便日后的分析和日常运营决策。
其他文献
用采自安徽由第四纪红色黏土发育的红壤(红黏土)和采自江西由第三纪红砂岩发育的红壤(红砂土)进行室内培养试验,研究了添加富里酸对红壤酸度的改良效果和红壤酸化的阻控效果。结果表明,添加富里酸显著提高了两种土壤的pH,并且随着富里酸添加量的增加对土壤pH的提升效果逐渐增加,添加50g/kg富里酸处理红黏土和红砂土的土壤pH分别由对照的4.31和4.69提高至5.91和5.97。添加富里酸也提高了两种土壤
本文结合检验检测行业发展,以湖北大力推进区(县)公共检验检测机构整合为背景,介绍了武汉市蔡甸区公共检验检测中心整合、建设及运转相关情况,并提出相关建议.
本文将针对目前东莞电信全业务运营背景下光网络发展战略和策略进行全面的研究和分析,利用SWOT相关管理学理论和方法着重对总体环境、行业环境、竞争环境以及技术环境进行全
我和父亲是在晚上八点到达县城的,刚走出站台,父亲就说,你哥来接咱们了。我张望了半天,也没有看见哥哥,我说,哥哥在哪儿啊?那不是吗?父亲用手指了指。我又仔细地瞄了半天,才发现原来不远处冲我们挥手的那个人就是我哥。  我说,我哥老了,刚才差一点认不出来了。父亲不说话,脸上已没有了刚才的笑容。  哥哥从小就是我的学习榜样,只是在考高中的时候没有发挥好,落榜了。后来父亲说,鸡窝里飞不出金凤凰,也别费那劲,
期刊
本文对2015~2018年河南省人造板监督抽查的检验数据进行统计,全面分析了全省人造板质量安全发展状况,发现其中存在的主要质量问题,提出推动人造板行业质量提升的建议.
高校学生干部培养既关系到高校管理的顺利进行,也关系到学生的自我发展和成长,还关系到国家发展的人才获得。然而,当前我国高校学生干部培养面临着培养主体过于单一,集中多于
本文从环境监测全过程信息化能力和构建全程质控溯源系统的角度,从现场监测过程质控溯源信息化系统的构成、物联网和大数据质控方法运用、实验室信息管理系统(LIMS)的功能延伸等方面分析了环境监测全程质控溯源信息化系统建设思路与方法,并在此基础上按照从仪器端到系统端到监管端的步骤讨论了有效的实施路径和方法,为实现全程有效质控进行了方法上的有效探索。