基于基因表达谱的癌症标志物验证方法研究及知识库开发

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:A511429239
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前生命科学、临床医学、医药、及生物信息领域都重点关注生物标志物的研究。生物标志物对临床诊断及预后分析、新药物研制等具有明确的指导作用。从组学研究的角度一般利用分类和统计推断技术来差异表达基因等信息,寻找可能的风险因素。从人工智能的角度一般以知识库的构建为目标挖掘并结构化文献中的海量知识。基于模式驱动方法论的理念,本文设计开发了基因标志物的表达谱验证分析及知识库系统,主要工作内容有以下三个方面:(1)研究了基因标志物的生存分析技术,基于基因表达谱及含有删失数据的临床医学注释分析了基因表达对样本观测的生存时间的影响。利用基于Log-Rank检验的生存分析方法以最小P值为标准确定了基因表达的最优阈值进行风险组的划分。因为涉及到多重检验,所以利用不同的方法对最小P值进行校验。利用Cox比例风险模型直接验证基因表达对生存时间是否有显著的影响。(2)分析了如何用资源描述框架RDF(Resource Description Framework)描述基因标志物的知识信息,以及把RDF信息映射到有向属性图模型,分析了基因标志物知识库所需要的目标信息。分析了源数据服务器的Web页面的模板结构,设计并实现了基因标志物信息提取工具,提取了OMIM数据库及Geneards数据库中相关的基因标志物的信息。(3)设计开发了基因标志物的验证分析及知识库系统,预处理了一批基因表达谱及临床注释数据,开发了基因标志物的知识库,设计并实现了基因标志物验证结果及检索信息的可视化。
其他文献
互联网的快速发展,极大改变了人们的生活习惯,带动了移动互联产品的发展。市场上出现了越来越多的嵌入式产品,不同嵌入式解决方案提供商都提供带有自身特色的解决方案。由于解决
随着我国信息化的不断发展,数据库得到日益广泛的应用。同时,开放复杂的网络环境,使数据库中的数据受到了越来越多攻击威胁,所以,数据库安全技术研究也就成为了计算机技术研究领域
随着社会的发展,激烈的市场竞争要求企业能够快速地响应外部市场的变化。为提升企业的综合竞争力,及时处理瞬间万变的市场信息,各企业都在加快信息化建设。其中一个关键的工
实时仿真技术作为计算机仿真的应用分支,近年来伴随着计算机科学和信息技术的提高而快速发展。特别是仿真支撑软件的产业化、商品化和国际化进程中,计算机仿真已经成为现代设
本文首先介绍了分布式数据库系统的基本概念,如分布式数据库系统的定义、特点、数据分布及系统体系结构等,然后简要描述了分布式查询的处理策略、优化目标及代价估算。接着本文
随着数字媒体技术和计算机网络技术的迅猛发展,互联网上在线图像的飞速增长,在浩如烟海的图像数据资源中迅速精准地查找所需的图像数据却变得越来越难以实现。因此,如何对图像信
Agent与MAS(多Agent系统)理论与技术是计算机科学与人工智能发展较快的一个领域,同时也为我们提供了新的研究思路与方法,MAS理论与技术已经广泛应用于交通控制、工业生产、网
作为一种重要的非结构化数据,视频已经成为大数据存储与管理的重要组成部分。近似视频广泛地存在于互联网的海量视频文件中,检索这些近似视频将有利于进行视频库精简、搜索引擎
全机模型测力实验是一项常规实验,目的是测量作用在全机模型上的空气动力和力矩,为确定飞机空气特性提供原始数据。在模型风洞实验的各个环节上,都可能出现误差。应尽可能消
近年来,小波包变换技术已逐步进入各种应用领域。小波包能够把信号的高频细节部分进一步细分,在数字水印的应用上极大地拓展了水印信息的嵌入空间,并且小波包分解的特点适用