基于Tri-training的迁移学习方法及其在信贷领域的应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:lixin062
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,金融机构广泛使用有监督学习方法建立信贷风险预测模型。然而,在新开信贷业务中,带有结果标签的数据通常较为稀缺,导致有监督建模缺乏有效的训练数据。本文设计了一种新的迁移学习方法,来缓解跨地区新开信贷业务的训练数据稀缺问题,进而建立有效的信贷风险预测模型。本文改进了半监督模型Tri-training,然后将其融入迁移学习,创新性的提出了Trans TRIT迁移模型。Trans TRIT引入了置信度约束,并按照“少数服从多数”的原则来筛选辅助样本,最后利用集成学习提高模型的泛化能力。与其他迁移方法相比,Trans TRIT使用更灵活,预测结果更鲁棒,时间和空间性能上优于特征迁移。本文以美国最大的网络借贷平台Lending Club的公开数据为例,将拥有数据量多的地区作为源域,数据量少的地区作为目标域。本文基于不同的地区和基学习器设计了六组实验,分别将Trans TRIT同传统模型及其他迁移模型的预测效果进行对比,来评价该模型的有效性。实验结果表明:在大部分地区下,Trans TRIT展现出更好的风险预测效果;该模型不易受到基模型及源域数据量变化的影响;随着源域数据量的增加,以XGBoost作为基模型的Trans TRIT能够更有效的处理混杂数据,进而稳步提升风控效果。本文认为可以通过Trans TRIT模型对信贷数据进行跨地区迁移,来帮助金融机构在新开信贷业务前期进行风险防控。
其他文献
杨木作为速生林主要树种,存在强度低、材质差等缺陷,严重限制了其高效利用。因此,对速生杨进行改性,赋予其高附加值,对于缓解木材供需矛盾、减少能源消耗、推进整个社会的可持续发展,具有重要的学术和现实意义。本论文以速生杨木为原材料,采取多步改性工艺,开发出高强度、多功能的木材基复合材料,通过结构表征和性能测试,阐述木材结构、功能的改性原理。并且,对木材进行整合,制备单板层级材,为木材高附加值利用提供新方
锐钛矿相TiO2是锂离子电池最主要的负极材料之一,因其成本低、稳定性好、安全性高、循环寿命长、以及良好的理论容量而受到广泛关注。但是锐钛矿相TiO2的低电导率和较低的锂离子扩散系数限制了其电化学性能,特别是在高充放电倍率下的性能。为了提高锐钛矿相TiO2的倍率性能,本文采用丙三醇-乙醇混合醇为溶剂,通过溶剂热及进一步煅烧法制备了不同CNTs含量的CNTs@TiO2复合材料,研究了溶剂热反应过程中丙
空气载能辐射空调作为一种可以同时满足夏季制冷和冬季供暖需求的新型辐射空调形式,近年来的研究多围绕吊顶型应用方式,在末端构造优化、载能空气能量利用、室内环境调控方面尚有研究空间。随着装配式建筑的发展,装配式墙板因其制造效率高、装饰一体化等优点,被广泛应用于装饰集成墙面。本文以实现辐射对流优势互补、室内舒适性提升、室内空气能量分配优化为目的,提出一种基于装配式墙板的空气载能空调系统。通过理论分析、数学
大苞藤黄(Garcinia bracteata C.Y.Wu ex Y.H.Li),隶属于藤黄科(Guttiferae)藤黄属植物(Garcinia),果实可食用。本文采用现代色谱分离技术,结合现代波谱学和量子计算化学等方法,从大苞藤黄果实95%乙醇提取物中分离并鉴定了26个化合物(1-9,10a,10b,11,12,13a,13a?,14-1,14-2,15,16,17a,17b,18a,18b
在极端环境条件下,电网装备、飞机、高铁等大型设备器材的机电性能会显著降低,严重影响其安全稳定性。国内外目前还没有低成本实现极低温复杂环境与高速运动相结合的综合条件下电工电子产品、飞行器、高铁、风机等装备材料、器件和缩比模型的检测与试验的仪器装备系统。而要在实验室模拟极寒、极低气压、雾霾和沙尘等各种恶劣环境,并进行机电特性研究,必须使检测装置放置于密闭空间内,若仍采用传统风洞进行设计和建造将耗费极高
随着我国保险行业的高速发展以及公众健康意识的不断增强,商业健康保险得到了快速的发展,各家保险公司在商业健康保险领域的竞争也越来越激烈。在保险市场产品严重同质化的情况下,传统健康保险的比产品、比费用时代已经结束,竞争的焦点已悄然转变为创新的科技应用、管理能力和服务能力。近年来,以数据为核心的互联网、大数据、人工智能、人脸识别、云计算、区块链等信息技术逐渐应用到各个行业和领域,保险行业在产品定价、精准
在白酒行业的“黄金十年”时期,W公司顺应了改革开放下消费时代开启的趋势,通过卓越的产品品质,赢得了市场的认可,实现了跨越式的发展,品牌价值获得极大提升,跻身于行业标杆的地位。不过,过快的规模扩张、粗放的管理模式和战略定位的不明晰也为后续的发展埋下了隐患。在宏观经济增速放缓、行业结构整体失衡和行政法规约束的多重作用下,品牌繁杂、管理混乱、口碑涣散等问题开始集中爆发,公司品牌价值被稀释,市场竞争力变弱
随着中国城镇化进程进入高速增长期,高密度的建成环境逐渐占据本不富裕的绿地空间,如何处理人地矛盾与构建生态美丽宜居城市成为热点话题,这时衍生出了提倡建设“人城境业”高度融合的大美城市形态的新时代“公园城市”新理念,即有机融合公园形态与城市环境,完善绿地空间“一公三生”的布局,促进自然文化与社会经济的可持续协调发展。同时,城市公园作为推动人与自然互动发展的公共空间类型,随着人民日益增长的需求与城市功能
随着《“健康中国2030”规划纲要》的实施,商业健康保险进入新发展阶段,疾病、医疗保险产品种类繁多,健康保险保费收入持续增长,但与我国14亿人口基数相比,目前的商业健康保障覆盖面不高,需求端存在着许多制约因素。国内外学者已从人口结构等层面分析商业健康保险的需求影响因素,然而传统经济学的理性人假设具有局限性,无法完全解释健康保险市场的需求异象,因此国内外学者逐渐采用行为经济学的理论,将经济学与心理学
自20世纪60年代以来,在投资者—东道国争端解决中,国际投资仲裁逐渐成为主要的争端解决机制,但是国际投资仲裁程序冗长耗资巨大,对国际投资双方当事人来讲都是沉重的负担,并且,仲裁程序的“对抗性”使得国际投资当事人针锋相对,不利于维护当事人之间友好经济合作关系,尤其随着我国“一带一路”倡议的提出,对完善投资者—东道国争端的解决机制提出了新的需求。在ISDS机制改革背景下,以调解解决投资争端的呼声高涨,