一种基于投影聚类的无监督表型区分算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:zxcmnbv1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量微阵列技术与手工表型标定方式间的矛盾导致了基因表达数据的获取与表型确定间的不平衡.然而,已有的表型区分方法大多是有监督的,并且通常忽略了基因间广泛存在的相互作用,根据单个基因的独立区分能力划分样本表型,选择相关基因.从新的视角,基于投影聚类的思想,提出一种考虑基因间相互关系的无监督表型区分算法USPD.通过将基因表达数据转化为具有负间隔约束的序列数据,强化了基因间的相互关系.利用设计的质量函数,采用深度优先方式遍历样本穷举树,无监督地生成样本表型划分.同时采用高效的削减策略,大大提高了算法的效率.通过将算法与现有的以基因表达数据分析为目的的代表性投影聚类算法HARP相比较,证明提出算法的高效性和有效性.
其他文献
利用烷基胺阳离子处理和伊利石K-Ar年龄分析法,对采自塔里木盆地和吐哈盆地的两类泥岩样品进行了研究.一类泥岩样品以成岩伊利石为主要黏土矿物,另一类以成岩伊利石/蒙脱石混
国有垄断的发展在一定程度上阻碍了经济的发展.本文利用让·梯若尔的公司金融理论建立了一个符合我国国有垄断行业的融资模型,利用该模型推导出我国垄断行业的确定的企业数量
亚太旅游协会第八届年会于2002年7月10日至13日在东北财经大学旅游与酒店管理学院召开.本文就会议所探讨的主要问题和观点进行了综述,从中可以窥视近年来旅游研究的发展趋势
通过合成的El NiNo和La NiNa的分析发现,一般一个El Nino或La Nina事件大致可以分成爆发前的冬季、发展期的夏季、盛期时的冬季和衰亡期的夏季四个阶段.在此基础上利用NCEP再
“民工荒”现象引发学术界关于刘易斯转折点是否已经到来的讨论,而我们认为问题的关键在于考察古典刘易斯理论对我国劳动力市场的适用性.基于总量和微观数据的经验研究表明古
利用NCEP/NCAR再分析资料和NCAR海温资料及中国测站地温资料 ,对ENSO循环不同阶段东亚夏季风强弱变化进行了分析。并从此期间的海陆热力差异和季风低压变化来探讨海温异常对
针对Vectran纤维增强型临近空间飞艇蒙皮用的柔性层压织物复合材料,利用非接触式数字散斑相关试验方法,测定了预制初始裂纹长度为15 mm的中心切口试样撕裂行为的位移场和应变
采用氧气雾化法制备出Ti6Al4V预合金粉末,并对粉末的粒度分布、形貌和微观结构进行了研究.结果表明:所制备的粉末颗粒细小,粒度呈正态分布.粉末大部分为球形或近球形,粉末表
口腔防龋疫苗经国内外学者的研究,发展迅速,大多数疫苗已被证实在动物身上具有防龋作用.但防龋疫苗具有效价低、不稳定、易降解等缺点,给其应用带来了困扰.水凝胶、壳聚糖、
临床数据共享平台是我国医疗信息化发展的重要方向,在当今医疗数据呈几何级增长的环境下,多中心海量的临床数据如何管理、共享、并有效地查询和检索是一项重要的课题.该系统