基因表达数据的分析与处理

来源 :西安理工大学 | 被引量 : 1次 | 上传用户：yobisisi

【摘要】

：

生物信息学是连接生物数据与医学研究的桥梁,是随着人类基因组计划的启动而兴起的一门新的交叉学科。基因组学、蛋白质组学和DNA芯片技术的发展,使得同时观测成千上万的基因

【作者】

：

吴敏

【机构】

：

西安理工大学

【出处】

：

西安理工大学

【发表日期】

：

2009年01期

【关键词】

：

基因表达数据处理生物信息学支持向量回归缺失值填充处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

生物信息学是连接生物数据与医学研究的桥梁,是随着人类基因组计划的启动而兴起的一门新的交叉学科。基因组学、蛋白质组学和DNA芯片技术的发展,使得同时观测成千上万的基因表达水平成为可能,如何从这些海量数据中挖掘出有用的信息,发现基因的功能具有重要的研究意义。缺失值处理和聚类分析是数据挖掘中的关键步骤。论文首先分析了常用缺失数据处理方法的优缺点,针对K-近邻(KNN)法插补速度快但精确度不高,支持向量回归(SVR)法插补精度高但相当耗时等不足,采用KNN与SVR相结合的方法实现缺失值的填充处理,通过对含有缺失值的酵母基因表达数据的实验结果表明,本文算法能够在较高插补精度的基础上有效地降低插补时间。其次,论文针对现有基因表达数据聚类算法存在的误判、聚类不精确等缺点,利用支持向量聚类算法(SVC)寻找最优分类超球实现对数据集的有效划分；并在现有的基于类内距离最小的聚类有效性评估准则的基础上,提出了一种加入类间信息的评价方法,通过模拟退火算法寻找SVC算法中的最优核函数参数和惩罚因子,以使聚类算法有更好的推广能力。对酵母细胞生长周期的表达数据集的仿真实验结果表明,SVC有较高的聚类精度,在新的聚类算法有效性评估标准下,模拟退火算法相对其他参数寻优法,能够更快更好地得到最佳参数。

其他文献

方坯连铸过程温度场仿真系统的研究与开发

随着我国钢铁工业的迅速发展,目前我国钢铁冶金行业的主要任务已经变为努力提高产品的市场竞争力,大力开发高品质钢材[1],要生产出高质量的钢材,就必须对钢的连铸过程进行合

学位

基于双DSP的多视频合成显示系统设计

随着信息技术、视频技术的飞速发展,无线、有线网络带宽的不断提升,视频处理系统在生产、生活、工业和医疗等许多领域得到了广泛的应用。而利用高性能DSP设计视频处理系统,作

学位

DM642DSP互连视频转换PCB设计

浅谈小学数学实践活动课的教学策略

小学数学实践活动融学科性、综合性、实践性为一体,开展活动要体现自主性、情境性、合作性,让学生学会综合应用所学的数学知识解决生活中的问题。在小学数学实践活动课教学中

期刊

小学数学实践活动教学策略

灰色预测控制在主汽温对象控制中的应用

针对电厂过热汽温系统的大惯性、大滞后和参数时变等特性,以及以往的模型算法控制和Smith预测控制等预测控制方法在模型失配中的不足,使用灰色理论与原来的预测控制算法相结

学位

过热汽温灰色预测模型算法控制自适应Smith控制Adaline

供应链风险测度与综合控制研究

随着物流产业和信息产业的不断发展，供应链管理带给企业越来越多的好处，其高效、快速、敏捷的运作特点大大降低了企业的库存和运输成本，显示出强大的竞争优势。然而由于供应链网

学位

供应链风险测度风险控制

柔性制造系统中基于petri网的死锁预防策略

柔性制造系统对有限资源的竞争会产生死锁现象。Petri网作为一种分析工具,可以有效地为柔性制造系统建模、分析并解决死锁问题。基于信标理论的死锁预防策略是Petri网死锁预防策略的研究方向之一,该策略为网模型中每一个严格极小信标添加控制库所和连接弧。理论上网模型中的信标个数与网规模成指数关系,网规模越大,信标的个数就会激增,从而导致添加了过多的控制库所和连接弧。本文针对Petri网的子类S~3PR网

学位

柔性制造系统(FMS)Petri网基本信标死锁预防

基因表达数据的分析与处理

其他学术论文