论文部分内容阅读
随着分子生物学和生物信息技术的飞速发展,生物的许多重要性状和基因得到了精确定位,于是便产生了海量的生物数据。如何从这些异构的数据中挖掘出有用的信息,成为了当前的研究热点。与此同时,本体被引入生物界并得到广泛应用,人们已成功建立了水稻、拟南芥、大豆等植物本体,整合了各自领域的异构数据并挖掘出了有用的信息。笔者选取棉花生物信息作为研究出发点,构建本体,设计出本体编辑工具,以期实现该本体的半自动构建和可视化,为挖掘棉花生物信息提供相关研究工具。本文首先介绍了本体的相关概念、常用本体构建方法及本体构建工具,研究了国内外领域本体构建的关键技术,比较了本体构建方法和工具的优缺点,总结出各自存在的问题;在此基础上,分析了棉花生物信息本体的构成,提出了构建棉花生物信息本体的可行性、基本原则和构建方法,详细介绍了整个构建过程,接着通过引进解析XML的技术,设计了基于Dom4j的自动生成棉花形式化本体(OWL文件)的算法,并实现了形式化本体的自动生成;此后,文章引入了可视化的概念。针对本文生成基于Web的本体树形图的需求,分析了在Web上生成树形图的几种技术,详细阐述Dtree技术的具体功能、体系结构以及方法参数等内容。通过对比分析,选择该技术实现基于Web的本体树形图可视化;而后,综合之前的研究内容,运用相关技术和数据库知识,设计出了基于MVC模式的棉花生物信息本体的半自动构建和可视化的原型系统。该系统建立在棉花生物信息本体知识库的基础上,通过用户操作实现术语和术语关系的添加、修改、删除以及查询等功能。对于构建成功的本体,系统可以自动生成形式化本体文件(OWL文件)并显示本体树形图,实现可视化功能。文章详细介绍了系统的总体设计、功能模块和系统结构框架等内容,选择了棉花生物信息本体的部分术语及术语关系对其进行测试和评价,验证了本文研究方法的可行性和实用价值。最后,笔者对研究中存在的问题与不足之处,提出了改进措施并指出了后续研究方向。本文总结了本体构建的研究现状,成功构建了棉花生物信息本体,研究了棉花生物信息本体的半自动构建和可视化算法,设计实现了棉花生物信息本体的半自动构建和可视化原型系统,论证了研究方法的可行性,并对系统进行了测试和评价,实现了本体编辑、形式化本体自动生成和可视化等相关功能,对今后的研究具有一定的实践意义和参考价值。