基因表达数据的分析与处理

来源 :西安理工大学 | 被引量 : 1次 | 上传用户:yobisisi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是连接生物数据与医学研究的桥梁,是随着人类基因组计划的启动而兴起的一门新的交叉学科。基因组学、蛋白质组学和DNA芯片技术的发展,使得同时观测成千上万的基因表达水平成为可能,如何从这些海量数据中挖掘出有用的信息,发现基因的功能具有重要的研究意义。缺失值处理和聚类分析是数据挖掘中的关键步骤。论文首先分析了常用缺失数据处理方法的优缺点,针对K-近邻(KNN)法插补速度快但精确度不高,支持向量回归(SVR)法插补精度高但相当耗时等不足,采用KNN与SVR相结合的方法实现缺失值的填充处理,通过对含有缺失值的酵母基因表达数据的实验结果表明,本文算法能够在较高插补精度的基础上有效地降低插补时间。其次,论文针对现有基因表达数据聚类算法存在的误判、聚类不精确等缺点,利用支持向量聚类算法(SVC)寻找最优分类超球实现对数据集的有效划分;并在现有的基于类内距离最小的聚类有效性评估准则的基础上,提出了一种加入类间信息的评价方法,通过模拟退火算法寻找SVC算法中的最优核函数参数和惩罚因子,以使聚类算法有更好的推广能力。对酵母细胞生长周期的表达数据集的仿真实验结果表明,SVC有较高的聚类精度,在新的聚类算法有效性评估标准下,模拟退火算法相对其他参数寻优法,能够更快更好地得到最佳参数。
其他文献
随着我国钢铁工业的迅速发展,目前我国钢铁冶金行业的主要任务已经变为努力提高产品的市场竞争力,大力开发高品质钢材[1],要生产出高质量的钢材,就必须对钢的连铸过程进行合
学位
随着信息技术、视频技术的飞速发展,无线、有线网络带宽的不断提升,视频处理系统在生产、生活、工业和医疗等许多领域得到了广泛的应用。而利用高性能DSP设计视频处理系统,作
小学数学实践活动融学科性、综合性、实践性为一体,开展活动要体现自主性、情境性、合作性,让学生学会综合应用所学的数学知识解决生活中的问题。在小学数学实践活动课教学中
针对电厂过热汽温系统的大惯性、大滞后和参数时变等特性,以及以往的模型算法控制和Smith预测控制等预测控制方法在模型失配中的不足,使用灰色理论与原来的预测控制算法相结
随着物流产业和信息产业的不断发展,供应链管理带给企业越来越多的好处,其高效、快速、敏捷的运作特点大大降低了企业的库存和运输成本,显示出强大的竞争优势。然而由于供应链网
柔性制造系统对有限资源的竞争会产生死锁现象。Petri网作为一种分析工具,可以有效地为柔性制造系统建模、分析并解决死锁问题。基于信标理论的死锁预防策略是Petri网死锁预防策略的研究方向之一,该策略为网模型中每一个严格极小信标添加控制库所和连接弧。理论上网模型中的信标个数与网规模成指数关系,网规模越大,信标的个数就会激增,从而导致添加了过多的控制库所和连接弧。本文针对Petri网的子类S~3PR网
兼职教师是五年制高职校师资队伍的重要组成部分。五年制高职校需要一支过硬的师资队伍,兼职教师教育教学水平的高低将直接影响职业学校人才培养质量的好坏。加强兼职教师队
小学生品德的形成来源于学生对生活的认识、体验与感悟。在小学品德教学中,教师应以学生的实际生活为基础,体现教学内容的生活性,具体做法如下:第一,在课前导入中,列举贴近学
初中化学新课程改革所倡导的新理念对传统化学教学提出了挑战.在义务教育阶段,化学教学注重探究式、合作型及实践型的教学理念,因此,化学教师可通过以下策略开展化学教学活动
新课改强调师生之间的友好合作关系,教师与学生是学习的共同体。教师干预下的自主课堂是“师本”与“生本”的融合体,是一种教师主导、学生主体的“双主”课堂。因此,信息技