实例选择相关论文
自从1956年首次提出以来,人工智能经历了若干次低谷和高潮。随着深度学习算法的提出,人工智能在21世纪又迎来了一次发展的高潮。数......
随着数据的获取渠道、维度及数量的增加,人们直接收集到的数据集中可能包含着许多噪声、失实、冗余等影响数据集质量的实例。这些......
随着信息技术的发展,各领域的数据规模以惊人的速度扩张,这一方面给机器学习、数据挖掘等任务带来了更多的训练信息,另一方面增加......
惰性学习不同于传统的急性学习,它具有训练代价少、假说空间丰富、渐进学习能力强、能进行增量学习等优点,因而被广泛应用于数据挖......
支持向量机(SVM)作为机器学习中一种常见且有效的分类器,已经成功地用于各种分类学习中,从模式挖掘到计算机视觉,从医学诊断到信息......
随着软件系统的不断更新和迭代,软件系统变得越来越庞大和臃肿,这为系统后期的开发和维护带来了很大的不便。为了解决这一问题,业......
软件开发不是一蹴而就的,软件将长期处于运行且持续演化的阶段。在软件演化过程中,对源代码进行修改可能会导致缺陷的产生,软件演......
近邻分类是机器学习的重要研究内容之一。其中K近邻分类算法是一种非常典型的非参数懒惰学习方法,因其简单有效等特性被广泛应用于......
SFL算法是一种经典的进化算法,相对于其它进化算法,它收敛快速等诸多优点。据此,本文提出一种基于SFL算法的实例选择算法(SFLSS:Sh......
为提高多重约束下的调度成功率,提出一种满足期限和预算双重约束的云工作流调度算法。将可行工作流调度方案求解分解为工作流结构......
为突破数据不平衡对算法的限制,更好地将子群发现技术应用到数据不平衡领域,设计了一个适合入侵检测数据集与子群发现算法的数据简......
近邻分类法在训练分类器时需要存储训练集中所有的数据,这种缺点会导致程序在运行时需要大量的存储空间和运行时间。据此,本文提出......
针对数据简化中的实例选择问题,基于抗体克隆选择学说提出了一种免疫克隆数据简化算法.利用马尔可夫理论证明了该算法能以概率1收敛......
基于实例的机器翻译(example—based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹......
教师在对开放教育学员进行重点、难点的教学辅导过程中可引入实例进行教学,这样能有效地帮助学生理解、掌握所学知识,使教学形式更......
阐述了实例选择的定义和关注点,分析了Hausdorff距离的相关概念和特点,提出了一种基于权重的Hausdorff距离,并以此为基础设计基于Haus......
针对实例选择算法INSIGHT存在选出的实例类别分布不均衡和得分相等的实例的重要性无法区分两个问题,分别提出了改进算法。改进算法......
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,提出了一种面向K最近邻(KNN)的遗传实例选择算法。该算法采......
大数据时代的到来,使得海量数据的存储代价、基于实例的机器学习算法的性能和效率均面临极大挑战。通过从原始训练集中选取对数据......
摘要:朴素贝叶斯分类器是一种基于独立假设的贝叶斯定理的简单概率分类器,依靠精确的自然概率模型,在有监督学习的样本集中能获取得非......
K近邻的分类性能依赖于训练集的质量。设计高效的训练集优化算法具有重要意义。针对传统的进化训练集优化算法效率较低、误删率较......
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,本文提出了一种遗传实例选择算法。该算法采用基于决策树和......
NB方法条件独立性假设和BAN方法小训练集难以建模。为此,提出一种基于贝叶斯学习的集成流量分类方法。构造单独的NB和BAN分类器,在......
实例选择能有效移除数据中的噪声和冗余数据,但现有方法难以在提高泛化能力的同时实现约简。针对该问题,提出一种冗余实例对消除算法......
文本数据具有高维稀疏的特征,并且数据量也在爆发式增长,这给传统的机器学习算法带来了许多困难,具体表现在以下两方面:其一,对于......
随着通讯技术的发展及异构网络的广泛融合,网络数据呈现爆炸式增长态势。虽然其中的异常事件属于稀有类,但仍会对国家、企业及个人......
随着网络技术的飞速发展以及广泛应用,网络安全成了越来越重要的问题。如何能快速、准确、有效地识别已有的攻击和日益增多的新的攻......
在机器学习中,用于算法学习的数据集中往往充斥着大量的杂质和无用信息,在用这些数据集进行机器学习的算法学习任务时,一方面会造成计......
为提高无线网络入侵检测模型的综合性能,该文将循环神经网络(RNN)算法用于构建无线网络入侵检测分类模型。针对无线网络入侵检测训......
运用决策树技术对高频心电图进行分类和识别.采用Bagging和Boosting方法,分类准确率得到一定程度的提高,从76.3%分别升至79.8%和77......
讨论基于数据规约的近似挖掘技术,在数据预处理阶段对海量数据集进行数据规约.近似数据挖掘的工作流程包括任务定义、数据准备与预......