基于MIAME的基因表达数据融合方法设计及应用实践

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liongliong513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分子生物学的发展,分子生物数据爆炸式增长,出现了众多的公共分子生物数据源。研究者可以通过这些公共数据源平台获取来自不同数据源的分子生物数据,对数据进一步利用,探寻其中所包含的生物学意义。而来自不同数据源的数据,往往存在着格式上的异构,需要研究者花费大量时间和精力对数据进行预处理,从而给研究工作造成了很大的挑战,是当前急需解决的重要问题。  基因表达数据是分子生物数据的重要组成部分, GEO(Gene ExpressionOmnibus)和ArrayExpress是目前国际上最主要的两个基因表达公共数据库,分别采用SOFT和MAGE-TAB格式来存储海量的基因表达数据。然而,SOFT与MAGE-TAB之间存在数据格式定义上的较大差别,使研究人员难以同时利用来自GEO和ArrayExpress的数据进行进一步的数据分析和生物医学研究。  针对上述问题,本论文的目标是研究基因表达数据的融合方法。2001年FGED组织建立了微阵列实验最小信息集MIAME(Minimum Information About aMicroarray Experiment),用于规范基因表达数据所需包含的基本内容。根据SOFT和MAGE-TAB格式均遵循MIAME规范这一基本情况,论文的主要研究思路是基于MIAME标准,建立针对多种基因表达数据格式的映射关系,实现不同格式的基因表达数据之间的转换,具体工作如下:  剖析MIAME标准、SOFT格式、MAGE-TAB格式,分析基因表达数据的实验信息和原始数据两个部分的特点。建立实验信息的融合方法,确立MAGE-TAB为实验信息的融合标准,建立SOFT到MAGE-TAB之间的映射关系。建立raw data的融合方法,确立以Agilent格式为主体,GenePix和Affymetrix为补充的raw data融合标准,并建立三种芯片数据格式到融合标准的映射关系。根据本论文建立的融合方法,开发数据转换工具,实现不同格式基因表达数据转换。  本论文通过真实数据进行数据转换,证明了融合方法的有效性,为基因表达数据融合提供了一种可行的方案。  
其他文献
本文通过对荣华二采区10
期刊
本文通过对荣华二采区10
期刊
视频图像作为远程医疗系统的重要信息,为实时远程医疗诊断和监护提供了重要依据。然而视频巨大的数据量,给其存储和实时传输带来了极大的困难,已阻碍了远程医疗技术发展,因此
本文通过对荣华二采区10
期刊
法学本科教育对于实务技能的培养具有局限性,目标应当定位为培养合格的法律职业者“毛坯”,此“毛坯”经过工作的历练才能成为一名真正的法律职业者.因而,法学本科教育对于学
“三会合一”,主题明确.省委常委、市委书记周江勇在会上强调,要深入学习贯彻习近平总书记在考察浙江、杭州时的重要讲话精神,牢记殷殷嘱托,扛起使命担当,认真对标对表,以一
期刊
推进规划系统集成rn以“十四五”规划编制为统领,依托全省空间治理数字化平台,率先构建市域统筹空间发展的新模式、新机制和新体系.rn绘就市域空间一张图.集成发展规划、国土
期刊
学位