论文部分内容阅读
对于征信系统从大量数据源采集数据的问题,利崩SVM学习机最大化分类超平面与支持向量之间距离的特性提出自动化相似记录匹配方法。使用最近邻居法自动选择初始训练样本集,在此基础上对支持向量机进行自动训练,使分类超平面逐步逼近旺配实体对与非匹配实体对的分类边界,实现自动的实体旺配函数学习,通过实验分析,该方法在实现自动对相似记录进行匹配运算的同时可获得较高的匹配精度。