面向多特征集成的粒化建模方法及其应用研究

来源 :江苏科技大学 | 被引量 : 2次 | 上传用户:skyxinqiann
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,特别是近年来云计算、物联网、社交网络等新兴服务的快速普及,人类社会产生的数据规模正以一种前所未有的速度增长.从大规模复杂数据中,以应用需求为目标,挖掘有效的信息已经成为现代科技发展的主要驱动力.然而,现代数据具有描述的多样性、来源的广博性、结构的复杂性、增长的飞速性等典型特征,探寻如何从规模庞大且复杂异构的数据中获取蕴含的深层信息和隐含知识,相对于传统的数据挖掘与知识发现任务而言,显得任重而道远且极具挑战性.目前很多大规模复杂数据处理方法中,分而治之是一种能被广泛接受的策略,即先采用适当的抽样或分层技术对复杂数据进行合理的“分割”,再建立高效的学习机制对各部分数据进行针对性地处理,该策略体现了人类面临复杂问题时所拥有的多粒度认知能力.但粒度世界的多样性致使有关多粒度的研究面临计算复杂度高、对指定目标特性掌握不够、缺乏足够的融合思想与动态学习能力等严峻挑战,鉴于此,本文将在复杂数据背景下,分别从标记多特征空间的信息粒化、参数多特征空间的分类器设计、多特征空间的融合学习方法等方面来探索高效的多粒度信息粒化技术,并以此为基础发展新的多粒度建模与知识获取方法.具体而言,本文的研究内容和创新性成果主要在于:(1)单标记下的特征空间转换策略与粗糙数据分析.有关粗糙集的研究大多建立在原始特征空间之上,并未考虑具有不同决策类别的样本可能拥有自身特定的性质,而这些特性往往有助于产生更为精准的规则.为此,本文针对决策系统中不同的决策类,提出了一种能够反映各个决策类性质的多特征空间转换策略,并给出了多特征空间下决策系统近似质量和条件熵的定义方法,有效地降低了决策系统的不确定性程度,提升了分类性能.(2)多标记下的特征空间转换策略与粗糙数据分析.考虑到不同标记可能会带有其自身的一些特性,故为多标记学习构建类属特征空间显得尤为重要.然而,类属特征空间的构建可能导致特征空间维度的增加,且含有大量冗余信息.为了缓解该不足,本文借助模糊粗糙近似约简的思想,提出了两种基于类属特征空间维度约简的多标记学习方法,即:FRS-LIFT和FRS-SS-LIFT.其中,FRS-SS-LIFT在FRS-LIFT的基础上,采用了样本选择策略,大幅降低了维度约简的时间消耗.相关实验结果验证了本文算法在提升多标记学习系统预测性能的可行性和高效性.(3)参数化特征空间下的协同分类方法.在邻域粗糙集模型中,随着信息粒尺寸的增长,基于多数投票原则的邻域分类器容易对未知样本的类别产生误判.为了缓解该不足,本文借助协同表达的思想,提出了一种邻域协同分类器NCC.该算法在未知样本的邻域空间内,通过协同表达的方式找出与未知样本具有最小重构误差的类别作为预测的类别标记.相关实验结果在验证本文算法能够提升较大尺寸信息粒下邻域分类器分类性能的同时,也表明该算法是一种降低传统CRC算法时间消耗的有效手段.(4)多特征空间融合策略下的蛋白质结构类型预测方法.本文针对生物信息学中蛋白质二级结构类型的预测问题,先从Pse AAC和Pse PSSM两个视角抽取了蛋白质序列的特征,并将两者以串行方式融合,再以k-近邻错误率最小化为目标,借助启发式搜索策略,提出了一种基于k-近邻错误率下降的蛋白质结构类型预测方法.相关实验结果表明本文算法对蛋白质二级结构预测的准确率有一定程度地提升.
其他文献
随着计算机网络和多媒体技术的快速发展,快速有效地进行海量视频数据检索已成为一个亟需解决的问题。视频数据库索引的建立是视频检索的重要基础,基于视频内容分析的自动视频标
RAID具有高带宽、大容量、高可靠性和易于管理的特性,而广泛应用于存储系统中。随着云计算的发展,如何实现RAID的高效在线扩展成为研究热点。针对已有的RAID-4扩展方法采用循环
经过对车载影音导航系统在国内外以及高校的研究现状进行分析,研究了基于嵌入式计算机技术为核心的嵌入式车载影音导航系统的原理和构成。结合项目的实际需求,针对合作企业产品
随着遥感技术的发展,海洋遥感影像数据以TB级/天的规模增加。而云存储环境的超大存储空间、价格低廉、部署方便等优点,为海量海洋遥感影像的存储和管理带来机遇,越来越多的用户选择将海量影像数据存储移植到云中。海洋遥感影像具有大批量、大尺度和高敏感等特性,实际应用中海洋遥感影像中的港口、近海岸以及海岛信息是影像数据的核心,也是影像数据变动的敏感区域。因此敏感区影像的安全与准确对海洋环境变化、资源配置、灾害
伴随着信息技术在各个领域的蓬勃发展,如何进行快速、有效的个人身份验证,已逐渐成为人们关注的焦点。人脸识别相比于其他生物特征识别技术具有很多独特的优势,研究人脸识别可以
软件新技术的飞速发展和网速的不断提高对流量数据检测提出更大的挑战,如何在日益复杂的网络环境下进行流量数据检测已经成为目前一个重要研究课题。本文在现有研究成果的基础
电子商务在企业的发展、人们的生活中产生了重要影响。电子商务模式,是指企业在互联网的条件下开展电子商务,为了满足企业目标顾客的需求以及为实现盈利目标而采取的一系列商业
近年来,在网络时代的技术背景下,互联网技术在企业和用户需求的合力推动下迅速蔓延。流媒体作为代替普通文字和图片的网络媒介,在互联网中得到了爆发式的推广和应用。在现有
随着云视讯、共享空间等新型技术的应用,存储在网络上的信息呈现爆炸式增长。信息的海量积累和动态变化阻碍了人类对它的有效利用。为了解决从海量数据中准确、有效地查询最优