空间环境生物信息学数据的分析方法研究

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:milai8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是由生物学、应用数学、计算机科学相互交叉所形成的学科,而数据挖掘作为一个崭新的计算机应用领域在生物信息学中有着广泛的应用。空间环境生物信息学数据的分析方法研究是在生物信息学范畴内,基于当今日渐成熟的太空技术展开,主要用来研究空间环境对水稻种子产生的生物学效应的机制,即针对空间环境诱变因素数据以及生物学实验分析获取的表型组、蛋白质组的变化信息数据进行存储、集成和管理,在此基础上,对数据进行聚类分析、关联规则挖掘,试图找出空间环境诱变的机理及蛋白质组改变机制。在查阅大量国内外参考文献基础上,本文开展了以下几项工作:构建诱变水稻变化信息的数据库系统,其中包括空间环境诱因信息、诱变水稻的表型组和蛋白质组信息。构建数据仓库,解决不同组学之间存在的数据不一致、冗余、噪声等问题,为后续的数据分析与挖掘工作打下良好的基础。提出了基于投票机制的动态聚类融合算法,该算法自动确定聚类个数,利用不同的相似度准则运行k-means算法,实现了动态确定运行次数,并将多次运行得到的结果映射到关联矩阵,使用投票机制获得最终的数据划分。该算法具有对领域知识要求和参数依赖程度低等特点。优化并改进了经典关联规则Apriori算法,该算法针对生物信息学数据普遍存在着维数过大、数据量巨大等特点,通过减少数据库记录的扫描次数及频繁项集的生成个数提高算法效率。
其他文献
模型驱动架构(MDA)是由对象管理组织提出的一种新的软件体系架构,近几年来发展很快。用例图和顺序图都属于统一建模语言模型图。在软件开发中,用例图是用来描述系统的功能需
中文领域术语自动抽取是中文信息处理中的一项基础性课题,在很多领域都有很重要的作用。如自然语言生成、计算词典编撰学、句法分析、语料库语言学的研究、统计机器翻译、信
基于虹膜的生物特征识别技术具有识别精度高、无法伪造以及非侵犯性等优点,在门禁系统、海关出入境、机场和金融等许多领域中具有广泛的应用。现代虹膜识别系统为了适应各种复
宽带多媒体卫星通信系统是我国新一代多媒体通信系统,它采用先进的星上处理技术,以及波束合成区域的覆盖方式,并且通过ATM交换来提高频率复用能力,有着广阔的研究价值和社会效益
程序切片技术是一种重要的程序分析和理解技术,对程序进行切片的过程就是删除无关代码的过程,程序切片技术在程序调试、回归测试、软件维护、程序理解以及逆向工程等方面有着
机器翻译简单地说就是用计算机将一种自然语言翻译为另一种自然语言。作为信息的主要承载者,命名实体的翻译质量对译文的整体翻译质量具有十分重要的影响,命名实体的翻译也成
随着自动化测试技术的发展,自动化测试技术应用到越来越多的软件测试中,如何将自动化测试技术应用到数据库管理系统功能测试成为一个新课题。可扩展标记语言(XML)以其自身的
目前,图像信息的处理、存储和传输在社会生活中的作用已越来越突出,人们对图像信息的需求也越来越迫切。尽管数码相机和扫描仪传感器的分辨率不断增加,但是新的应用将永远需
随着信息技术的不断发展,企业的信息化管理水平在不断提高。作为一种对员工进行考核和评价的方式,传统的纸质考试已经不能满足信息化管理的需求。越来越多的企事业单位开始使
随着人民生活水平的提高,用电户的不断增加使供电部门抄表工作量大幅增长。传统的人工抄表由于存在诸多弊端已经越来越不能适应现代化管理的需要。自动抄表系统因其效率高、差