基于社交网络数据的信用评价数据清洗算法及快速实现

来源 :贵州财经大学 | 被引量 : 1次 | 上传用户:utpaxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融的快速发展,其作为传统金融业的有益补充,为低收入和中等收入群体提供了相对有效的金融服务。但由于缺乏信用评价方法,信用风险仍然是互联网金融业的主要风险来源。对自然人信用模型的构建及信用评价是降低信用风险的有效手段。随着在线社交工具的广泛使用,越来越多的人类个体行为被忠实地记录下来,形成了庞大的社交网络数据库。这些数据记录的是真实的人类活动,是对现实人群社交的部分映射,使得社交网络数据用来衡量用户的信用水平变得可能。本文我们主要进行了两方面的研究工作。首先在社交数据作为个人信用评价模型的补充数据的研究当中,网络中往往存在着社交足迹不足或无法代表普通真实用户的异常节点,这些节点的存在影响着信用评价的排序结果。因此我们根据用户的度分布,活跃度以及用户行为时间间隔来建立一套用于社交数据个人信用评价的数据清洗模型,并对清洗前后的数据集进行信用评价排序,观察清洗模型对结果产生的影响。其次我们对整个清洗模型进行了用例测试,找出整个清洗环节中最为耗时的部分并对其进行并行加速。在本文的第一章中我们对当前社交数据用于个人信用评价的研究背景及现状进行了介绍,并引出其中仍存在的问题以及我们要展开的工作。第二章主要对本次使用的相关技术方法进行了介绍。第三章的内容主要为本次研究数据的获取及描述。第四章中我们对整个清洗模型的构建及原理进行了阐述,并结合个人信用评价模型对清洗前后的数据进行计算排序。第五章的主要工作是找出整个清洗模型中最为耗时的步骤,并对其进行加速计算,提高清洗模型的响应速度。本次研究中通过用户特征属性和行为属性建立的清洗模型,是本文研究的重点。其中结合度分布,活跃度以及行为时间间隔所建立的清洗条件是本文的创新点。最终我们得到的清洗模型能够对个人信用评价中“真的假数据”进行清洗。
其他文献
试论跨国公司的商品与劳务在内部转让时的价格问题张丽,张瑜1987年底,国务院批准了中国第一家跨国集团公司,即中国化工进出口跨国集团总公司。直至1994年6月,我国在境外投资的企业已近4500家,分
期刊
财务状况变动表与现金流量表的比较万晓文在当前的会计理论界和实务界,要求以现金流量表取代财务状况变动表,成为会计报表体系中第三大表的呼声越来越高。适应会计信息使用者的
耕牛慢性氟中毒诊疗报告陶池有(桂平市木乐镇兽医站537202)近年来,笔者在临床诊疗中,发现几头中青年牛牙齿畸形怪状,体躯骨异常;起初无法辨症施治,后来经过多方面的检查和分析,诊断为耕牛慢
佛光寺唐代彩塑,不仅为五台山彩塑的精华,而且是国内外罕见的艺术珍品,如此浩大的场面和惊人的气势,只有在鼎盛的唐代才会出现,因此说,像佛光寺这样规模宏大,作品精美,
1991-1994年调查广西各地蔗区,发现14种甘蔗新害虫,其中地下害虫3种,鞘叶害虫11种.栗等鳃金龟、甘蔗根象是新发现的甘蔗重要地下害虫,两者均年发生一代,在广西局部地区造成严重危害.
红外弱小目标检测是军事、交通、监控等领域的热点研究问题之一,但由于成像距离远,目标呈现出微弱的点状特性,没有明显的纹理和边缘信息,给目标检测带来了很大的难题。目前,针对不同背景下的红外弱小目标图像,学者们提出了不同的检测算法,但鲁棒、通用的红外小目标检测算法一直是本领域追求的目标。以不同背景下的机载红外弱小目标图像序列为研究对象,论文应用张量分解理论研究红外弱小目标检测方法及算法,主要工作如下:介
在改革开放和宗教与社会主义相适应的背景下,建议五台山区政府开发一个五台山般若苑。苑内各景点的分布、安排,是由殊像寺、塔、陈列馆、文殊雕像群、佛艺演示场、开智堂、园林
近年来,随着申报世界遗产话题在国内外的升温,五台山的申遗工作也越来越受到社会各界的关注.从旅游区发展的角度看,申报遗产的过程,是一个让外界深入认识五台山的自然、文化
浅析可转换债券的会计处理戴铭,朱朝辉今年4月召开的国务院证券委第六次会议提出了要选择有条件的股份有限公司进行发行可转换债券的试点。其实,可转换债券对我国的公司和投资者