【摘 要】
:
在机器学习、模式识别和数据挖掘等领域,多标记数据广泛存在,并且呈现出高维化趋势。多标记数据的高维特征增加了存储代价和计算成本。很多学者提出了一些多标记特征选择方法对高维特征数据进行降维处理。其中基于粗糙集理论的特征选择方法被称为属性约简,其是在保持知识分类或决策能力不变的条件下,删除不重要或不相关的属性。利用粗糙集理论进行属性约简的主要优点是不需要待分析数据的任何先验和附加知识。近几年,许多学者提
论文部分内容阅读
在机器学习、模式识别和数据挖掘等领域,多标记数据广泛存在,并且呈现出高维化趋势。多标记数据的高维特征增加了存储代价和计算成本。很多学者提出了一些多标记特征选择方法对高维特征数据进行降维处理。其中基于粗糙集理论的特征选择方法被称为属性约简,其是在保持知识分类或决策能力不变的条件下,删除不重要或不相关的属性。利用粗糙集理论进行属性约简的主要优点是不需要待分析数据的任何先验和附加知识。近几年,许多学者提出了一些多标记数据属性约简的方法。这些方法在保持原始特征可识别能力不变的情况下,去掉冗余的属性,提高了学习算法的分类性能。然而,它们在处理大规模数据集时,计算约简耗时较大。为提高这些属性约简算法的计算效率,本文对于多标记数据属性约简算法,设计了通用的加速算法。首先,用一组偏序关系来刻画目标概念,研究动态粒度下的粗糙集近似。然后,当粒度由粗变细时,在逐步去掉正域的数据集上研究属性外部重要度的保序性质。最后,基于此,提出通用的多标记数据属性约简的加速算法,并对五种代表性的多标记数据属性约简算法进行了加速。进一步,在多标记数据公开测试集上验证了加速算法不仅有效地减少了属性约简的计算时间,而且能够保持原始算法的约简结果。当处理更大规模数据时,加速算法的有效性和高效性变得更加明显。
其他文献
加快经济发展方式的绿色转型,核心问题是加快工业发展方式的绿色转型。党的十八大以来,生态环境保护上升到前所未有的国家战略高度,相关政策文件密集出台,随着这些政策措施落地,工业发展方式绿色转型取得了一定成效,但也存在发展困境。在实现“双碳”目标的艰巨任务下,需积极应对工业能耗结构难以快速转变、工业绿色技术发展储备不足、工业产业结构优化升级压力较大、工业区域发展关系面临调整难题、工业绿色转型的体制机制不
最高人民检察院规划民事诉讼监督机制的"精准化"发展导向,旨在以精准监督的理念革新推动民事检察工作深度融入全面建设社会主义现代化国家进程。民事诉讼精准监督的具体内容是要完善多元化监督格局、四级分工工作格局、民事检察监督程序机制、精准办案工作机制,以补足民事诉讼监督在总体检察格局的发展短板,优化资源配置与实现精准布局。监督对象精准化须坚持法定性与必要性标准的统一、被动监督与能动监督的结合、当事人缠诉风
啤酒灌装机的清洗效果对纯生啤酒微生物污染的控制尤为重要,本文就如何改善纯生啤酒灌装机清洗效果,提高酒机最后清洗水的微生物合格率进行分析探讨。
本文以2008—2020年我国A股上市公司为研究对象,考察了机构交叉持股对企业商誉泡沫的影响。研究发现,交叉持股的机构投资者可以有效抑制企业商誉泡沫;机制研究表明,交叉持股的机构投资者主要通过降低企业代理成本和信息不对称来抑制企业商誉泡沫;进一步研究发现,在内部控制质量和市场化程度较高的企业中,交叉持股的机构投资者对商誉泡沫的抑制作用更为明显;此外,相比一般法人类机构投资者,金融类机构投资者交叉持
<正>项目化学习在小学语文阅读教学中的运用,改变了以教师的“教”为主体、学生被动“学”的传统阅读教学方式。在小学语文阅读教学中引进项目化学习,能够极大地提高学生学习的主动性,有利于培养小学生的语文学科核心素养和实践创新能力。项目化学习的实施模式项目化学习,通俗来说是以教学目标、理论依据、完成目标的条件以及教学步骤和教学评价实施的过程为主体。知识先行模式。以小学语文三年级为例,让学生先预习,而后使用
<正>中国制造业有着转型升级、高质量发展的强烈需求,同时,也恰逢转型升级、高质量发展的巨大历史机遇。智能制造是我国制造业创新发展的主要抓手,是推进制造强国战略的主要技术路线。我国必须充分发挥后发优势,采取数字化、网络化、智能化“并行推进、融合发展”的技术方针,实现制造业数字化转型、智能化升级。
作业是提高教学质量的有效手段。但现在的作业设计存在内容单一、结构散乱、功能窄化的现状,究其原因是教师对作业的功能定位不准。单元作业对学生巩固单元知识,提高思维能力,发展数学素养起着重要的作用。因此,教师在设计作业时要把握单元学习目标,分析内容知识水平,引领学生系统梳理单元知识,在综合应用中深化知识的理解,提升关键能力,发展综合素养,打造“教—学—评”一致性的高效课堂。
根据住房和城乡建设部官方网站发布的统计数据可知,2010~2019年我国建筑施工安全事故起数、死亡人数连年上升,尤其是高处坠落事故在所有建筑施工安全事故中的年平均占比超过50%,成为建筑施工发生频率最高、死亡率最高的安全事故类型。工程实践表明,由单一风险引发的高处坠落事故并不常见,大多数建筑施工高处坠落事故是多个风险耦合作用的结果。因此,摒弃“孤立地看待风险”的守旧思路,从风险耦合的角度出发,探究
<正>当前,数字经济已经成为推动我国经济高质量发展的重要动力,不仅为发达地区提供了新的发展机遇,还为赋能欠发达地区更快、更好地发展带来新机遇。在国家政策和数字技术发展的推动下,各地区实体经济与数字技术融合逐步加深,实体经济的数字化、网络化、智能化水平不断提升,成为经济增长的重要引擎。
中国共产党领导下的工业化实践,是一部谋求国家富强、民族独立、人民幸福的探索史。从建党之初培育、壮大工业化阶级基础到土地革命时期明确工业化的新民主主义革命性质,从抗日战争与解放战争时期军事、民用工业并重夺取全国性革命胜利到新中国成立后社会主义工业化道路的曲折探索,从改革开放时期开辟具有中国特色的新型工业化道路到新时代贯彻落实工业化的新思路、新理念以开拓新格局,穿越历史的风云变幻,立足中国国情的工业化