粗糙互信息的不平衡多标记特征选择算法

来源 :安庆师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:glory001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择作为处理多标记学习中数据高维性的一种有效方法,得到了众多学者的研究与关注。由于部分特征仅仅与某些标记有着强相关性而与整个标记空间的相关性不强,不能简单通过与标记空间整体的相关性判断取舍。此外,多标记的分布是不平衡的。因此,根据标记密度对标记空间进行划分,并分别进行相关性的判断,同时在不同标记空间进行不同比例的采样。引入具有补的性质的粗糙熵代替传统熵的度量方式,提出了基于粗糙互信息的不平衡多标记特征选择算法,在5个公开数据集上的实验结果表明了算法的有效性。
其他文献
根据数字近景摄影测量的原理和方法,运用非量测数码像机进行建筑物外形的量测,应用MultiGenCreator结合CAD技术,建立三维虚拟场景,应用VegaPrime实现三维漫游。
在隧道地质病害施工处理过程中,利用监控量测数据信息和地质勘测成果进行综合分析,解决隧道在开挖中出现的涌泥及地表塌陷问题,拓展了隧道监控量测的应用范畴,有效消除了施工安全
首先,给出拓扑空间中任意子集都是紧致子集的两个充分条件;其次,研究拓扑空间中紧致子集的交、并、闭包仍是紧致子集的充分条件;最后,给出拓扑空间中的紧致闭子集族所具有的
自驱动粒子系统在生物系统、交通运输系统领域具有广泛的应用价值。本文提出了一维双向自驱动粒子模型,在模型中考虑粒子的跳跃、粒子间的换位等行为。运用模拟仿真方法分别
用概率的方法分析了体育比赛规则修改的合理性,讨论了比赛规则修改后所产生的影响及作用.提出了针对2008年奥运会的一些对策及应该做的部分准备工作.
利用无符号拉普拉斯谱半径与特征向量之间的关系式,研究有n个顶点、最小度为δ且边连通度k′<δ的这一类图中无符号拉普拉斯谱半径最大的图。假设G0是这一类图中无符号拉普拉
通过对收集到的载荷试验、静力触探对比试验资料的统计分析,提出一种较切实可行的静力触探极限承载力公式,供勘察和设计使用,以推动原位测试方法在岩土工程勘察中的应用.