CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组序列拼接的主流方法是将整条序列随机打断成小片段,然后根据片段间重叠关系连接成长序列.由于较多噪音存在,算法复杂度高,加之生物数据的海量增长,序列拼接处理导致巨大的时空开销而无法完成.本文提出一种基于最大频繁序列模式的聚类算法,将整个数据集分成若干个子集,分别高效地处理,实现了一个基因拼接网格系统、透明动态的资源管理,大大扩展了基因拼接计算能力.基于最大频繁序列模式聚类算法及挖掘算法,针对生物数据的特性做出了优化.
其他文献
畜禽养殖管理是对畜禽养殖区域的规划布局、畜禽养殖场的设置、畜禽的饲养、畜禽疫病和养殖污染的防治等及其相关的监督管理活动以法律的形式进行约束,旨在规范畜禽养殖行为,
为按照用户的需要定制售卖产品的公司提供支持的基于知识的配置系统,产品配置器是人工智能技术的一个重要应用.本文首先描述了配置问题及其相关概念,然后分析了某些配置知识
近年,随着清远市城镇化进程的提速和经济作物种植面积的扩增等,水稻种植面积日益缩减,严重影响了区内水稻的年产出量.怎样在有限的土地上生产出高质、高量的水稻成为水稻从业
期刊
期刊
由于前向神经网络隐合层节点数的确定尚无理论依据,为此提出一种基于黄金分割原理的优化算法,首先确定网络隐含层节点数频繁出现的区间范围;将网络总误差作为试验结果,然后利
期刊
茶油树是我国四大木本油料之一,适合生长在温暖湿润的气候环境中.茶油色清味香,营养丰富,耐贮藏,是优质食用油 ;也可作为润滑油、防锈油用于工业.茶饼既是农药,又是肥料,可提
随着经济的快速发展,人们生活品质得到大幅提高,人均寿命逐年延长,我国已进入老龄化社会.随着人均寿命的延长,医学研究也指向老年疾病,其中老年冠心病的研究便成为了热点问题
期刊