基于样本处理机制的属性约简方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:dwlqw008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目前很多复杂数据处理的方法中,粗糙集理论作为智能信息处理的一种重要方法,对于研究如何通过已有的数学工具来模拟人的思维活动和认知过程有着不可低估的作用。但当数据的结构变得复杂多变时,经典粗糙集理论已经不再适应实际应用。为此,利用粗糙集理论处理复杂问题就必须从数据出发,重新扩展粗糙集的相关概念。本文从样本的抽样、样本间的二元关系及样本标签等不同的视角出发,以粗糙集为数据建模和属性约简为研究内容,取得了如下的研究成果:1.针对生活中存在的很多不平衡数据,从粗糙粒计算的角度来看,基于邻域决策错误率的属性约简虽然提高了分类器的分类性能,但是这样的约简策略没有能很好的关注不平衡数据中的少数类样本。为此,设计了一种基于样本采样方法的属性约简,以期望达到提高小类样本分类精度的目的。2.属性约简作为粗糙集理论研究的核心问题之一,虽然具有丰富的语义解释,但这一方法仍然可能会带来过拟合现象。这种过拟合现象与学习任务中的过拟合是有一定区别的,因为属性约简的目标是找到一个满足给定约束条件的属性子集或者进行属性排序,而非训练出一个学习模型。因此属性约简带来的过拟合现象可以表现为在训练样本上所得到的属性子集满足所给的约束条件,而在测试样本上利用这一属性子集则有可能达不到约束条件。为此,设计了一种截断的启发式算法。其目的是为了缓减或消除属性约简中出现的过拟合现象。3.伪标记决策粗糙集的数据建模。在决策粗糙集理论中,决策代价用于生成表示概率近似的阈值。与其他粗糙集相似,这一过程可以通过使用不同的二元关系来形成许多广义的决策粗糙集。然而,应该注意的是,大多数计算二元关系的过程并未考虑样本的标签信息,这可能导致较低的分类性能。例如,带有不同标签的样本被认为是无法区分的。为了弥补这一空白,本文提出了一种伪标记策略,用于构建新的决策理论粗糙集。
其他文献
环境风垂直切变是影响中尺度对流的重要环境因子之一,其对对流发生发展与维持过程的影响仍存争议,需进行进一步探究。此前有学者通过统计观测资料提出对流层上层垂直风切变是
随着港口货物装载的发展日趋智能化和自动化,对集装箱起重机的控制要求也越来越高。由于起重机-吊载组成的系统动力学特性,小车在运行过程中会使吊载产生摇摆,这样不仅降低了
随着财产性利益这一概念的产生,大量的侵犯财产性利益的违法犯罪行为也不断出现,例如现实生活中常出现的通过诈骗手段取得欠条以逃避债务的行为等。关于诈骗财产性利益的既遂标准,学界有许多不同的理论观点,然而诈骗财产性利益既遂标准的确定,关系到罪与非罪的界分问题,也关系到是否能够通过刑法的规制作用来切实保障人民的财产安全。除此之外,笔者还将对何为财产性利益进行分析,以及通过与域外法的比较来对我国刑法关于诈骗
蓝果忍冬属于寒地特色小浆果树种,是一种新兴的商业水果,其营养价值可媲美蓝莓等浆果树种,甚至一些生物活性成分的含量要大大高于蓝莓,具有很高的营养保健和经济价值,深受广大消费者的喜爱。但由于蓝果忍冬果实果皮较软,易受物理损伤进而导致不耐贮运,影响蓝果忍冬产业的经济价值。为此,本研究以蓝果忍冬品种“蓝精灵”为研究对象,通过探究1-甲基环丙烯(1-MCP)、微环境气调(m MA)、微环境气调结合1-MCP
关系抽取作为自然语言处理领域中一项重要的基础任务,目的是判断出文本语句中实体对之间存在的语义关系,在知识图谱、智能问答等应用领域中发挥着重要的作用。传统的基于有监督的关系抽取方法完全依赖人工标注来获得训练语料,需要花费大量的时间,消耗大量的人力资源,因此,通过自动标注来获取大量语料的远程监督方法逐渐成为关系抽取任务的热点。远程监督的前提假设是:如果在知识库中的一个实体对存在某种关系,那么所有包含有
近年来,随着计算机技术的飞速发展,越来越多的智能计算方法孕育而生,群智能算法做为智能计算的核心,一直是国内外专家学者研究的热点。花朵授粉算法作为一种近年提出的极具发展前景的算法,由于其具有的控制参数少、易于实现、结构简单等特点,已经成功的被运用到诸多的领域。但是,与传统的群智能算法相类似,其依然存在着局部搜索较差,收敛到稳定最优解的速度慢和最优解的精确度不高等不足。为了进一步提高花朵授粉算法的性能
微物理参数化方案对于高分辨率模式网格尺度深对流的模拟极为重要,模式云和降水输出对方案中参数的微小变化非常敏感,风暴尺度集合预报是估计预报不确定性的有效手段。本文基
美越战争结束后,双方签订了《巴黎和平协定》,其中规定的权利和义务以后将成为两国争论的焦点,即美国失踪士兵战俘问题和越南要求美国提供战后援助之间的矛盾。1975年4月,南
由于医疗活动具有高度的技术性和专业性,在医疗事故罪中,医疗过失行为与危害后果之间因果关系的认定一直是一个难点问题。在刑法中行为人承担过失刑事责任的前提条件是过失危害行为与危害结果之间存在刑法上的因果关系。因此在医疗事故刑事责任追究中对因果关系的确定显得十分重要。因此,笔者认为有必要对医疗事故罪中因果关系的确定进行研究,希望可以解决医疗事故罪中因果关系难以判断的问题,并可以运用到司法实践中。第一章通
在航天领域中,由于飞行器在穿过地球大气层时会经历高温、高压、高焓等的极端工作环境,因此可能会危及飞行器内部结构甚至工作人员的安全。为了保证结构的安全使用,预测结构的使用寿命,需要对热载荷作用下C/C热防护复合材料的烧蚀与热响应进行分析,并研究其烧蚀机理。随着电子计算机技术的飞速发展,更由于烧蚀问题的特殊性,在研究C/C复合材料的烧蚀时,数值模拟的优势愈发地突显出来。同时由于烧蚀过程中边界移动问题的