论文部分内容阅读
以信息技术支持脑科学研究已经成为一种普遍的跨学科协作模式。脑数据库、脑数据挖掘工具等多样化的信息技术应用已成为脑科学研究的强大助力,推动着数据为核心的脑科学研究的飞速发展。在脑信息学领域,思维为核心研究的特点决定了信息技术对研究的支持重点在于多样化实验研究和计算研究的整合。其基础是数据、信息和知识的整合。脑科学研究领域现有的各种信息技术应用主要关注于对特定研究活动的信息技术支持,缺乏一种有效的手段来实现这种整合。因此,脑信息学研究者需要研究新的信息技术以实现脑信息学数据循环过程中关键数据、信息和知识的整合,开发新的跨学科协作模式。本文从系统化的脑信息学研究需要构建脑信息学数据循环系统这个实世界问题出发,抓住其中的关键问题—数据、信息和知识的整合,在概念数据建模,本体开发、脑数据库系统开发、领域驱动的数据挖掘等已有研究的基础上,基于脑信息学数据为核心的研究过程,紧扣概念数据建模这一信息系统开发的关键技术,以脑数据的概念建模为切入点,提出了一个基于数据脑的数据-信息-知识整合框架。在该框架中,数据脑作为一个新型的领域驱动的概念数据模型,被用来建模脑信息学方法学,并通过数据源和分析源,整合脑信息学研究全过程涉及的关键数据、信息和知识,支持系统化脑信息学研究。本文以脑信息学为领域背景,对基于数据脑的数据-信息-知识整合框架的核心理论和技术进行研究,涉及数据脑建模、基于数据脑的系统化脑数据管理和数据脑驱动的系统化脑数据分析。数据脑建模是构建脑信息学数据-信息-知识整合框架的核心问题。为建模脑信息学方法学,数据脑不是传统意义上的脑数据库概念数据模式,也与现有的各种脑模型、脑本体存在差异。因此,本文首先从数据脑建模的研究动机出发,给出了数据脑的定义,并基于系统化的脑信息学方法学,设计了多视图、多维的数据脑框架;然后根据数据脑的特点,明确了本体化的建模过程以及数据脑的本体特性,并基于本体建模相关理论设计了数据脑元模型,为数据脑建模提供了理论和技术基础;最后,扩展传统的通用本体建模方法,将领域特性注入本体建模过程中,设计了基于脑信息学方法学的数据脑建模过程。并利用数据脑元模型,从各个维度的构建、维间关系构建到概念视图抽取,较为细致地描述了数据脑的构建过程及其形式化定义。作为沟通脑信息学实验研究和计算研究的桥梁,系统化脑数据管理是脑信息学数据-信息-知识整合框架的基本功能。它不仅要实现面向数据存储和数据共享的管理,而且要实现面向系统化脑数据分析的管理。本文在分析了现有脑数据库,特别是fMRI、EEG/ERP数据库的基础上,对系统化脑数据管理进行了概括。指出其中的核心问题是收集和存储来自于系统化脑信息学研究不同侧面的数据信息,并有效地组织和利用这些信息来支持系统化脑数据分析和模拟过程中人或智能Agent的多侧面、不同层次的数据信息分析操作。随后以解决该核心问题为研究出发点,讨论了脑信息学源的概念、分类、形式化定义和构建过程,并给出了源立方体的定义、构建方法和基本操作,为实现系统化脑数据管理提供了理论和技术基础;最后,借助一个针对归纳推理实验数据的案例研究,描述了利用脑信息学源和源立方体满足多侧面、不同层次的数据信息分析需要的过程,展示了本文所提出的基于数据脑的系统化脑数据管理实现策略的有效性。系统化脑数据分析是脑信息学方法学的一个重要侧面。对它的支持是脑信息学数据-信息-知识整合框架的一个核心功能。本文在总结了现有多侧面脑数据分析的不足的基础上,提出了数据脑驱动的多侧面脑数据分析方法以弥补现有的专家驱动的数据分析过程的不足。该方法将多侧面脑数据分析过程建模为一个自动知识发现Agent的有组织社区,以数据脑和脑信息学源为核心知识库,借助检索、推理、语义匹配、服务动态规划等技术,将多样化的数据和分析方法组织成候选的多侧面分析工作流。进而基于这些候选分析工作流,一个四阶段的分析方法学被提出以实现数据脑驱动的多侧面脑数据分析。相关理论和技术成果被实现为一个原型系统。基于该原型系统,一个数字归纳推理的多侧面脑数据分析被执行以描述数据脑驱动的多侧面脑数据分析的全过程。从理论层面讲,本文的意义在于(1)提出了一个基于数据脑的脑信息学数据-信息-知识整合框架,作为信息技术支持脑科学研究的新模式;(2)研究了领域驱动的概念数据建模相关的理论、技术以及具体的实现方法和策略;(3)为实现系统化脑数据管理提供了一个基于数据脑的解决策略;(4)制定了数据脑驱动的系统化脑数据分析策略,完成了相关理论、技术探索。从实践层面讲,本文的意义在于:(1)基于思维为核心的脑信息学研究的特定需要,完成了脑信息学数据-信息-知识整合框架的核心技术探索和实践工作,推进了系统化脑信息学方法学由抽象的概念向具体的、可操作的研究路线和策略转化,是在全球范围内推广脑信息学研究的关键;(2)作为超世界数据循环系统研究在脑信息学领域的一个研究案例,尽管本文的研究是针对脑信息学领域特点的,但相关理论、技术、方法和策略也可被进一步推广到其他领域,推进超世界数据循环系统相关研究的发展。