非共现数据两阶段加权IB算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：standups_wu

【摘要】

：

非共现数据是指不符合联合概率分布,而是符合一个未知函数的数据.将非共现数据转化为共现形式后可以采用熵来定量度量信息并进行聚类.但是,现有算法假设非共现数据的各个属性

【作者】

：

姬波叶阳东

【机构】

：

郑州大学信息工程学院计算机科学技术系,

【出处】

：

小型微型计算机系统

【发表日期】

：

2012年10期

【关键词】

：

非共现数据特征加权两阶段信息瓶颈方法聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

非共现数据是指不符合联合概率分布,而是符合一个未知函数的数据.将非共现数据转化为共现形式后可以采用熵来定量度量信息并进行聚类.但是,现有算法假设非共现数据的各个属性特征对聚类贡献均匀,没有考虑代表性属性和不相关(冗余)属性对聚类效果的不同影响.因此,本文提出一个非共现数据的两阶段加权IB算法(TSAW-sIB),在非共现数据共现转化的两个阶段,从“非共现/共现/联合”三个视角观察非共现数据,突出代表性属性,抑制冗余属性,获得更能准确反映非共现数据特征的数据表示并进行聚类.实验表明,TSAW-sIB算法优于ROCK、COOLCAT和LIMBO算法. Non-co-occurrence data refers to data that does not conform to the joint probability distribution but to an unknown function.When the non-co-occurrence data is transformed into co-occurrence form, entropy can be used to measure and cluster the metric information.However, The characteristics of non-co-occurrence data contribute uniformly to the cluster without considering the different influence of the representative attribute and the irrelevant (redundant) attribute on the clustering effect.Therefore, this paper proposes a two-phase weighted IB algorithm (TSAW-sIB). In non-co-occurrence data co-occurrence transformation, non-co-occurrence data are observed from three perspectives: “non-coexistence / coexistence / union”, highlighting representative attributes and suppressing redundant attributes , And get the data representation that can more accurately reflect the characteristics of non-co-occurrence data.Further experiments show that the TSAW-sIB algorithm outperforms the ROCK, COOLCAT and LIMBO algorithms.

其他文献

认真贯彻落实《农产品质量安全法》全面提升农产品质量安全水平

《农产品质量安全法》实施以来,吉林省农委按照农业农村部统一安排,认真落实习近平总书记“四个最严”(最严谨的标准、最严格的监管、最严厉的处罚、最严肃的问责)要求,深入

期刊

一刊在手致富不愁想致富，请订阅2017年《特种经济动植物》

《特种经济动植物》(原名《国外特种经济动植物》)是由中华人民共和国农业部主管、中国农业科学院特产研究所主办的全国唯一的特种经济动植物专业性国家级科技类期刊,为中国

期刊

订阅经济

提高混凝土耐久性的措施

本文提出通过掺入高效减水剂、掺入高效活性矿物掺料等手段来提高混凝土强度，使得混凝土耐久性得以提高。

期刊

耐久性减水剂高性能混凝土

采薹菜用油菜“一种双收”栽培新技术

采薹菜用油菜“一种双收”是在常规栽培油菜的基础上,利用油菜薹应市早、品质好、口味鲜的特点,采用适当早播、早栽方法,让油菜早抽薹,抢在春节前后采摘新鲜菜薹供应淡季市场

建筑安装工程造价概预算审核中存在的问题

建筑安装工程造价概预算具体就是在建筑安装过程的整个过程中，结合各个阶段的设计文件中的相关数据以及指标和费用，采用某种方法对整个建筑安装工程的所有花费进行计算。该项措

期刊

建筑工程造价概预算现状解决措施

基于事件驱动的无线传感器网络动态分簇路由算法

为了降低应用于突发事件监测的无线传感器网络的能量消耗,设计实现了一种基于事件驱动的动态分簇路由算法.在人体神经系统工作机制和传感器网络分簇路由协议的基础上,建立了

期刊

无线传感器网络动态分簇路由算法事件驱动EDDCR

EDGE结构上一种通过超块重组加速单线程应用的方法

　　Explicit Data Graph Execution( EDGE)ISA是一种专门为类数据流驱动的分片式众核处理器而设计的指令集体系结构。相较于传统的采用控制流驱动的处理器,EDGE结构以超块(H

期刊

众核处理器EDGE线程级并行性超块TRIPS

对电力线路检修及缺陷的预测探讨

进入新时期以来,随着我国经济社会的高速发展,当前社会生产生活对于电力的需求呈现出巨大的需求,这就极大的促使了我国的电力行业飞速的发展.然而随着电力需求的不断增大,电

期刊

电力线路线路检修缺陷预测探讨

浅谈电子工程在现代建筑过程中的运用

伴随经济水平的不断提高，我国终于迎来了电子信息时代，计算机技术得到了迅猛的发展，被广泛应用于各个行业。在现代建筑行业中也有广泛应用。电子科技给现代建筑提供了很大的帮助

期刊

电子工程现代建筑现状应用

机载武器及其运用方案优化选择建模与仿真

提出了一种机载武器及其运用方案优化选择的数学模型,用以根据作战任务条件和目标,对地面机载武器挂载进行规划以及为作战中机载武器对目标的分配进行决策.该数学模型包括以

期刊

武器运用方案优化选择武器目标分配条件指数

非共现数据两阶段加权IB算法

其他学术论文