基于模糊粗糙集和标记增强的多标记特征选择算法研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:ltt3221340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘的发展,数据的高维特征空间已经成为了传统监督学习任务中的一大挑战。作为学习任务中的关键预处理步骤,特征选择主要用于减轻高维特征空间中不相关和多余的特征引起的“维度灾难”问题。作为一种有效的特征选择工具,模糊粗糙集理论能够有效地处理连续型特征下数据的模糊性,在近些年里引起了广泛关注。然而,不同于传统监督学习范式,在多标记学习中,除了数据的高维性,标记多义性也是多标记数据中一个突出的特征,即一个对象往往同时与多种语义相关联。除此以外,在大多数的实际应用中,不同标记对一特定实例的相对重要程度之间往往存在差异性,而传统多标记学习中的均匀分布假设无法有效地描述此种情形。因此,基于模糊粗糙集理论,本文以上述两个视角对多标记特征选择进行研究,并取得相关研究成果如下:1.基于模糊辨识矩阵框架,本文定义了模糊标记辨识关系和模糊相对辨识关系,以衡量特征空间和标记空间下实例对之间的辨识度。基于实例对之间的辨识关系,本文利用了特征的辨识能力以衡量特征与标记的相关性,并定义了基于辨识度的特征重要度度量。在此基础上,本文提出了一种基于模糊辨识度的排序算法,以实现多标记数据的特征选择任务。最后,为了验证所提出的方法的有效性,本文在10个选定的多标记数据集和多标记分类器MLKNN上,与四个代表性的多标记特征选择方法进行了对比实验。基于六个被广泛接受的评价指标,实验结果表明,所提出的方法在多标记数据的特征选择上取得了较好的表现。2.为实现标记相对差异性的描述,本文将标记分布学习融入到多标记特征选择中,用于挖掘标记空间中被等价关系忽略的监督信息。其中,本文基于粒计算视角,提出了一种新型标记增强算法,通过计算实例之间的模糊相似度来挖掘隐藏的标记相关性,并从逻辑标记中获得标记分布。为了处理标记分布数据的模糊性,本文将模糊粗糙集与判别指数相结合,提出了模糊邻域判别指数,以衡量连续型空间下特征的可辨识性。然后,本文提出了一种新的基于标记增强的特征选择算法来处理多标记学习中的高维性问题。为了验证所提出的算法的有效性,基于12个多标记数据集,本文选取了5个代表性的多标记特征选择算法,构建了一系列的对比实验。在六个广泛使用的评价指标下,实验结果表明,所提出的算法在与其他算法的对比中具有明显的优势。
其他文献
<正>人工髋关节置换术后假体脱位是一种常见的术后并发症,脱位一旦发生,将严重影响病人的生理功能和身体健康[1]。以往全髋关节置换术后应用钉子鞋和梯形枕固定以保持患肢外展中立位,可在一定程度上减少脱位的发生,但在术后翻身过程中仍有发生脱位的现象,且常使病人感到不适。基于此,本研究自制了一
期刊
食品安全问题,历来是社会各界普遍关注的焦点。目前,尽管我国食品安全管理的整体水平得以提升,但是由于“网红食品”的日渐畅销,因其而出现的食品安全重大隐患也随之暴露,食品安全问题仍然此起彼伏,已严重威胁人民群众的身体及生命健康。许多重大食品安全事故为民众敲响了警钟,公众陷入“我们还能吃些什么”恐慌之中,同时也折射出公众食品安全风险感知、认知的薄弱以及食品安全风险交流的滞后与缺失。在我国点多、线长、面广
学位
樟树(Cinnamomum camphora)是亚热带常绿阔叶林的代表树种,具有珍贵用材、医药化工、生态效益、景观欣赏等多重效益。树高冠大,姿态雄伟,寿命可与松柏比肩,但又不随俗、不喧哗,四季均保持着常绿的本色,具有独特的美学价值和文化内涵,被视为长寿、和睦、尊老爱幼和谦逊淡然的象征。从古至今,人们以诗词歌赋、故事传说、散文杂记以及影视歌舞等多种形式欣赏和赞美樟树,目前香樟树已成为全国37个地级城
学位
粮食最低收购价政策是保障我国粮食安全、增加农户种粮积极性和保障农户收益的有效手段。但是粮食最低收购价政策的出台并不一定能够有较好成效,只有农户对该政策有较高的满意度,才能激发其种粮意愿,调动农户种粮积极性,最大限度的发挥政策效能。因此,为了保障国家粮食安全,有必要厘清当前农户对粮食最低收购价政策的满意程度以及影响农户粮食最低收购价政策满意度的重要因素,这既有利于丰富粮食最低收购价政策的前因研究,也
学位
目前,我国对美丽乡村生态环境建设越来越重视,其中乡村人居林的营建是改善乡村人居生态环境的重要部分,同时也是我国新时代生态文明建设的新要求。本文以江西省91个行政村为研究区,对江西不同地理方位和地形村庄的乡村人居林的树种特征进行分析,同时针对江西省各地乡村人居林现状与村民的需求意愿展开问卷调查。结合村民需求,以推进乡村人居林构建经营技术体系的完善。本次研究得出的结论如下:(1)江西省乡村道路林植物种
学位
近年来,由于社会经济的快速发展,居民的物质生活水平显著提高,他们对精神文化的需求也与日俱增,因此带动了旅游业的蓬勃发展,促使人们加强了对风景区资源的开发利用力度。由于我国早期发展较为缓慢,对风景名胜区建设开始的较晚,且短期内发展迅速,因此导致其规划设计中出现了许多问题,尤为突出的就是生态保护与开发利用之间的矛盾,片面地追求短期经济利益而忽视了长远的环境效益,大量的景区开发无序,以至于风景名胜区的生
学位
我国当下城市化进程的不断深入,村落这个小型聚落单位发生了整体性的衰败。作为中国数千年小农社会的缩影,部分村落拥有着丰富的文化和历史资源。为了对这些具有重要价值的村落进行保护,从2012年开始国家开始了中国传统村落名录的构建,江西省目前共有传统村落343个。赣江是江西省第一大河,流域面积占江西省域面积的50%。赣江流域的地形与自然环境出现了较强的空间异质性,该区域间的差异性同样出现在流域不同方位的传
学位
传统村落的旅游开发与其景观吸引力密切相关,景观吸引力的强弱能够反映出当地旅游业的发展程度。查济村作为国家AAAA级景区、中国历史文化名村,同时也是首批入选中国传统村落的村庄,其丰富的景观资源成为了村落旅游开发的资本。也因此开展传统村落景观吸引力提升研究对查济村的旅游发展有着重要意义。本文主要从以下几个部分进行探究:第一,本文以AVC理论为基础,通过查阅相关文献资料对传统村落景观吸引力影响因素进行归
学位
毛竹(Phyllostachys edulis)向周边扩张入侵的现象十分严重,需要寻找出有效的管控手段。本文从非生物胁迫因子角度出发,选取了水分(盐、干旱)、氮素、铵氮代谢酶抑制剂、除草剂等因子作为胁迫手段,进行室内控制试验,测定幼苗主要生长及相关生理指标,探究毛竹幼苗对不同胁迫因子处理的生长及生理响应机制,以期为管控毛竹生长及其扩张提供理论参考,主要的研究结果如下:(1)随着Na Cl和PEG浓
学位
为探讨圆齿野鸦椿嫁接愈合机理,筛选出圆齿野鸦椿的最优嫁接方法,以加快圆齿野鸦椿优良无性系的繁育速度。本研究以8年生圆齿野鸦椿植株上的枝或芽作接穗,以2年生野鸦椿实生苗作砧木进行嫁接试验,研究不同嫁接方法对成活率、嫁接苗生长及光合生理特性的影响。并对“圆齿野鸦椿/野鸦椿”嫁接体接口愈合过程进行显微观察以及营养物质和相关酶活性的测定。研究结果如下:(1)比较了春季嵌芽接、切接和劈接法对圆齿野鸦椿嫁接成
学位