Gen-Cluster:一个基因表达数据的高维聚类算法

来源 :复旦学报(自然科学版) | 被引量 : 0次 | 上传用户:bianhao9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达数据聚类是分析基因之间共调控关系的重要手段.挖掘子空间中表达值存在差异但变化趋势保守的序列已成为基因表达数据聚类的主要研究内容之一.在N-同维趋势相似定义的基础上,提出了一个基因表达数据的高维聚类算法Gen-Cluster,将基因表达值转化为序列形式,采用无重复投影且无候选生成的序列模式挖掘策略自底向上挖掘N-同维趋势模式,并解决了OP-Cluster算法不能挖掘含有项集的序列模式问题,最终得到表达值变化趋势保守的基因序列形成的N-同维趋势簇.实验采用Breast Tumor和MicroRNA表达数据集,验证挖掘结果是有效的,且较OP-Cluster算法表现更高效率,并涵盖其结果.
其他文献
教育要从娃娃抓起。培养全民阅读,首先要培养学生的阅读;培养学生的阅读,责任在中小学校和广大中小学教师。让学生形成良好的读书习惯,最终培养学生终身阅读的习惯!
本文通过从培训基本情况、培训特色以及培训管理制度等方面详细介绍中国地质大学(武汉)青年教师发展培训体系构建情况,期望能对兄弟高校提供经验介绍。
在体育教育活动组织过程中,由于体育活动本身的特殊性,其存在的风险特别高。如何降低学校体育教学过程中的风险概率,是当今学校体育教育需要重点关注的问题。本文主要根据学校体
手机在给大学生带来便捷的同时,也对大学生课堂学习产生了极坏的影响:手机铃声干扰课堂秩序,手机短息分散课堂注意力,手机游戏转移学生上课兴趣,手机搜索功能引发思考惰性危机。面
目的 探讨核因子kB(NF-kB)和血管内皮生长因子(VEGF)在破裂颅内动脉瘤瘤壁的表达及相关性,并观察两者与瘤壁血管重塑的关系.方法 采用免疫组织化学方法对26例DSA和手术证实的
我们研究了二维.J1-J2模型中三种四量子比特的热纠缠特性,结果发现,临界温度基本上随挫变参量α的增大而减小.我们也发现,通过选择合适的挫变参量α可以制备最大纠缠态.
通过改变柠檬酸用量、反应时间及反应温度制得了不同特性黏度的低分子量淀粉;FTIR表明淀粉分子量降低到一定程度后,分子链聚集,分子链密度增加,特征基团数量增加,同时分子链
采用核/壳技术制备了P(VAc—BA)系乳液,探讨了核/壳组成变化对乳液性能的影响。研究表明,核/壳比相同时,壳中丙烯酸丁酯(BA)含量对乳液兀值、成膜性能及膜的力学性能均有影响;当核层和壳
针对一类具有可确定"时滞"的线性时变多变量控制系统的性能评价方法进行研究.利用特别定义的关联矩阵和正常相乘的方法,计算出LTV MIMO过程广义最小方差控制律的解析解,并由
应用B3LYP/6-31G(d)方法研究了气相状态下一系列复杂阴离子BF_4~-、AlCl_4~-、PF_6~-、NO_3~-、CF_3COO~-、CF_3SO_3~-、HSO_4~-及其与阳离子[Emim~+]形成的离子液体[Emim]BF