基于类别重要度的MIMLBoost改进算法

来源 :计算机应用 | 被引量 : 2次 | 上传用户:wyn44298
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多示例多标记学习算法MIMLBoost中退化过程造成的类别不平衡问题,运用人工降采样思想,引入类别重要度,提出一种改进的基于类别标记评估的退化方法。该方法通过对示例空间中的示例包进行聚类,把标记空间中的标记量化到聚类簇上,再以聚类簇为单位,利用TF-IDF算法对每个类别标记进行重要度评估和筛选,去除重要度低的标记,并将簇中的示例包与其余的类别标记拼接起来,以此来减少大类样本的出现,完成多示例多标记样本向多示例单标记样本的转化。在自然数据集上进行了实验,实验结果发现,改进算法的性能整体上优于原算法
其他文献
针对音频隐写算法载体利用率较低、不可感知性较差、嵌入效率不高的问题,提出了一种基于小波包分解与矩阵编码的自适应音频隐写算法。算法通过对比音频文件在MP3压缩前后小波包分解系数上的差异,将小波系数不变的位数作为嵌入载体,有效提高了嵌入容量;另外采用混沌模型产生随机三元组对矩阵编码算法进行改进,提高了算法的安全性与嵌入效率。算法在容量方面较直接选取中频子带小波系数作为嵌入载体的隐写算法提升约30%;信
当前的射频识别(RFID)系统只是简单地将防碰撞算法和安全机制粗糙地融合在一起。在分析经典自适应动态防碰撞算法的基础上,提出了一种内嵌安全机制的防碰撞策略。该策略将先序遍历机制、布尔运算双向认证协议内嵌入其中,解决了传统RFID系统标签识别效率较低、成本过高的问题,同时具有较高的安全性优势。与后退二叉树、动态自适应、二叉树搜索等算法进行比较,结果表明该策略能大大降低系统搜索的次数,提高标签的吞吐率
节点选择算法是影响P2P系统带宽利用率和吞吐量的关键技术之一。P2P应用存在逻辑路径和物理路径之间不一致、忽略了覆盖网拓扑与底层网络拓扑之间的关系等问题。邻居节点间上传和下载能力、稳定性会影响传输速率。针对这一问题提出基于统计学习的方法构建邻居网络,同时优先选择上传能力强、稳定性好的邻居节点。计算机仿真实验表明,新算法能显著提高P2P系统的整体吞吐量,减少用户的平均下载时间,从而有效地改善P2P系
向量模长即向量的长度,表现了向量的“数”的一面.当然,数和形是不可分的,向量是数形结合的一个典范.向量模长的计算是向量运算中的一个知识点,在解题时我们经常会遇到与向量的模结
图结构的特征提取及相似性度量是计算机视觉和模式识别中的重要研究内容。针对传统的方法对存在非刚性变换的图结构难以充分描述这一问题,给出一种基于图的上下文(GC)描述子的图结构信息描述及距离度量方法。首先,通过对图的边缘进行等距离散取样得到该图的采样点集;其次,基于图的采样点集给出图的上下文描述子;最后,采用推广的推土机距离(EMD)方法实现图的上下文描述子的距离度量。不同于图的编辑距离计算方法,所提
亲爱的同学们,数学学习,你一定非常重视解题,希望提高自己的解题能力吧.是的,解题是数学学习的重要形式.那么,怎样学习解题呢?本刊特辟“举题说法”专栏,通过典型问题的分析与解决,让你
多小区联合信道估计(MC-JCE)是多小区协作联合处理技术实用化的基础,然而现有MC-JCE算法需满足各小区信道功率延迟谱(PDP)相同且已知的条件。针对这一不足基于协作多小区正交频分复(OFDM)系统框架首先探讨在多小区信道PDP存在差异但已知条件下多小区联合信道估计的扩展算法(MC-eJCE),进而提出未知该信息条件下多小区联合信道估计的修正算法(MC-mJCE),同时为降低算法运算复杂度并获
大数据时代,开展面向海量、分布数据的知识发现研究成为学界和业界关注的热点,而负载均衡问题是开发分布式挖掘算法必须考虑的重要因素之一。为此,提出了一种基于垂直频繁模式树带有负载均衡的分布关联规则挖掘算法,算法采用垂直频繁模式树存储项及其关联而无需对局部挖掘结果进行合并,减少了通信量,简化了处理流程。同时所提出的算法采用混合体系结构即中心站点按照局部站点的处理能力分配任务,实现了负载均衡,提升了算法的