【摘 要】
:
参数k值的合理选取是KNN算法设计中的一个难点问题。目前k值一般凭经验选取,而且传统的KNN算法中所有的测试样本都用一个k值,这对于分布不均匀的样本来说显然是不合理的,可能
论文部分内容阅读
参数k值的合理选取是KNN算法设计中的一个难点问题。目前k值一般凭经验选取,而且传统的KNN算法中所有的测试样本都用一个k值,这对于分布不均匀的样本来说显然是不合理的,可能会降低分类的正确率。个人的信用问题是贷款违约的主要原因,建立有效的个人信用风险评估系统能降低银行的投资风险。为有效评估个人的信用风险,越来越多的学者开始把数据挖掘技术与个人的信用风险评估结合起来,设计或开发基于数据挖掘的个人信用风险评估模型,但在针对个人信用信息的自适应挖掘方面的研究还缺乏应有的成果。本文主要研究的是自适应KNN分类算法及其在个人信用风险评估中的应用。本文完成的主要工作如下:(1)针对KNN算法中k值需要提前设定而且是固定的缺点,提出一种基于局部密度和纯度的自适应KNN分类算法,该算法综合考虑测试样本的局部密度以及最大类所占的比重,测试样本选择可信度高的k值,使得测试样本的k值是通过学习样本的相关性得到的,而不是人为设定的,对于不同的测试样本选取的k值也不固定,从而提高了分类的正确率。算法可以用于无法通过经验或者需要长时间实验选取k值的情况,在一定程度上减少选取k值的时间。(2)在个人信用风险评估模型中,引入KNN分类算法。考虑到评估个人信用时,样本的每个属性所占的地位不同,可能有的特征对信用影响比较大,有的特征对信用的影响不大。对特征属性加权,提出一种改进的特征属性加权的KNN分类算法,然后将k值自适应的加权KNN分类算法应用于个人信用风险评估中,实验结果表明本文提出的算法对于个人信用的评估有较好的分类效果,可以应用到评估个人信用风险中。
其他文献
中国足协于2017年1月正式成为独立的社团法人,同年3月"秦升事件"的处罚争议,暴露出我国足协司法管理存在的问题。通过剖析英足总司法管理制度,将其与我国足球纪律委员会制度进
虽然石墨烯表现出很多极好的力学、光学、电学等性质,但是其本身的零带隙半金属性质严重限制了石墨烯在光电器件上的应用。紧接着科研人员继续寻找其他二维材料代替石墨烯。
目的:研究低剂量γ射线预照射对大剂量环磷酰胺化疗所致肝脏功能损害、外周血淋巴细胞DNA损伤及遗传物质损伤的影响,并探讨其可能机理。 方法:昆明种雄性小鼠随机分为空白
目的 探讨缺氧诱导因子1α(Hypoxia-inducible factor 1α, HIF-1α)在肺癌中的表达及其与血管生成和细胞凋亡的关系,评估它在肺癌发生发展过程中的作用。 方法 采用免疫
教师未教,学生已懂是课堂教学中常见的现象。教师可以通过密切把握学情,把对未知的探索转为对已知的思辨;注重课前预设,把对共性的追求转化为对个性的张扬;巧用移动卡片,在发
根据测序获得的1条260 bp cDNA片段,通过预测发现其包含小麦植物生长素(AUXIN)基因的部分编码序列,通过电子延伸、设计引物,从小麦Mardler/7*百农3217的cDNA中扩增获得一条608 b
英格兰足球运动历史悠久,成绩卓越。通过对英足总管理体制的核心“管理机构的设置”进行研究,并剖析理事会、董事会、职业赛事董事会、国家赛事董事会及英超联盟和足球联盟的
民居是建筑的主要类型之一,历史源远流长,与民众的生存环境、生活方式、心理特征和信仰崇拜等方面有着密切的关联。我国地域辽阔,南北差异显著,因此我国各族人民在长期的发展过程中,形成了独特的民居风格,民居建筑承载了鲜明的民族特色和丰富的地域风情。广西地处岭南,大部分地区的气候炎热、多雨、潮湿,民居的通风隔热、遮阴降温是建筑的关键问题。因此,在环境的影响和制约下,广西民居更多的体现出地域的特殊性和客观性,
律师制度的建立与完善是一个国家司法制度民主化的重要表现之一。本文以北洋政府律师法规的颁行为出发点,主要讨论了北洋政府时期律师制度的建立与发展问题,并在探讨过程中,
大学毕业生选择"零工资"就业,虽是严峻就业压力下一种不得以的选择,是为求得生存暂时的一种择业观念,但理性思考,这也确实扰乱了正常的就业市场、违反了法律的相关规定,不利于