基于优化k-mer频率的宏基因组聚类方法

来源 :吉林大学学报:工学版 | 被引量 : 0次 | 上传用户:kiddmanwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-mer频率是进行宏基因组分类时的一种重要的数字特征,然而该特征的维数随参数k的增加呈指数增长,利用该特征进行宏基因组分类易陷入"维数灾难"。为解决此问题,本文提出了一种基于优化k-mer频率的宏基因组DNA序列聚类方法。首先,提取DNA序列的kmer频率特征;其次,使用非负矩阵分解算法对DNA序列的k-mer频率特征进行优化;最后,利用模糊C均值算法进行聚类。将本文方法在包含有不同物种个数的模拟宏基因组数据上运行的结果表明,其能有效地克服现有宏基因组数据分类方法计算量大的缺点,且分类性能优于同类算法。
其他文献
关于河南省煤炭行业发展股份合作制企业的调查经营管理靳学斌杨保林(河南省煤炭工业厅郑州450003)1全省煤炭企业的改革概况党的十四届三中全会以来,国有企业改革进入制度创新阶段。全省
平顶山矿务局五矿通过对已三采区皮带石门过破碎岩层、断层带的支护试验研究,达到月成巷80m,二年内支护无维修量。
根据朱庄煤矿26114综采面底板钻孔注水及板岩层变形观测结果,分析了该工作面底板受采动影响的变化形破坏规律。
行政指导是行政管理的重要组成部分,它在现代行政管理活动中具有重要的作用。文章阐述了行政指导的历史必然性,然后归类分析行政指导存在的危机,最后提出解决行政指导危机的
食品安全自古以来都是人类生存和发展的基础,每个人的成长过程都离不开食物给与的能量,它关乎到每一个人的生命。药品在人类发展史上占据着非常重要的地位,人类因为发现了药
借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,然后用SVDD方法寻找包含大部分样本最小超球,保留各自支持向
企业实行民主管理是我国社会主义制度的本质要求,也是世界经济发展的必然趋势.企业改制,必须坚持和完善职工民主管理.
陈宧入川之前的四川局势严峻,匪患猖獗,地方势力尾大不掉,需要强大的武力作为后盾震慑之;冯玉祥的部队不但素质优良、具有剿匪经验,而且冯玉祥和陈宧有历史渊源,这能保证冯部
介绍了盘式成球机的转速,盘倾角,盘边高等参数在设计时应考虑的因素以及各参数在设备调试中的作用,并着重分析了盘式成球机在田力宝生产线中的应用情况。
介绍了利用顶升法在原有线路上施工涵洞的方法,它具有省时、经济、工期短等特点,特别是在矿区专用线下沉区处理涵洞是一种较为理想的方法.