论文部分内容阅读
随着科技的进步和计算机计算能力的提升,模拟仿真被广泛应用于气象模拟、计算流体力学、燃烧模拟等科学领域,这些模拟仿真通常利用多个变量来描述同一空间区域的不同物理或化学特性,因此,输出的模拟仿真数据通常具有大规模、高分辨率、多变量等特点。多变量三维空间数据可视化是模拟仿真领域的关键问题,通过可视编码多变量数据中隐藏的特征和潜在的关系,辅助领域用户深入理解科学过程,验证假设,甚至发现新的现象和规律。大规模的数据需要合适的数据表示方法,以达到减少数据量,同时保持关键信息的目的。变量间复杂的交互关系需要有效的分析建模和可视化方法,抽取和表达变量间的相似性和差异性等关系。总的来说,要使数据可视化、可视分析有效地辅助大规模多变量数据的探索分析,必须克服数据量大、变量间关系隐蔽、内在结构复杂等问题和挑战。本文以多变量模拟仿真数据为主要研究对象,围绕数据表示方法、相关性建模以及多变量特征及关系提取等问题展开研究。论文的主要研究成果概括如下:·提出了一套基于数值-空间联合聚类的多变量体数据统计表示方法。基于统计的数据表示方法因其能更好的保持数据的统计属性,更显著地减小数据大小,得到广泛的应用。本文方法利用数据的空间一致性,进一步提升数据表示的准确性和有效性。首先将体数据分块,结合数值和空间位置对块内数据进行聚类,建模数值分布信息,并利用高斯混合模型生成每个类中数值的空间分布表示。为了进一步减小数据存储所需空间,采用动态策略决定每个空间高斯模型所需的高斯分量数目。在数据重构阶段,根据贝叶斯定理结合数值分布和空间分布计算任意位置处每个类的概率密度函数,利用蒙特卡洛采样生成采样点最终的数值。·提出了一种基于特征子空间的协同分析框架,交互式探索多变量数据中多种形式的相关性。在该工作中,我们自动提取所有的特征子空间,即在一个变量集合上表现出相似数值模式的一系列体素。为了方便用户探索多变量数据中存在的大量的特征子空间,我们引入了一种解决子空间冗余的机制——根据变量集合进行分组管理和根据特征子空间的相似性进行层次聚类。基于提取的特征子空间,我们设计了多个可视化视图并定义了一套探索流程。用户可以根据矩阵视图中变量集合的相关性选取感兴趣的变量集合来进一步分析它所包含的特征子空间。特征子空间之间的相似性被展示在散点图中。当一个或一类特征子空间被选中,平行坐标中的数值分布相应展示了不同变量的数值间的关系。·提出了一种针对多变量数据中特征及关系的交互可视分析方法。多变量数据的变量间通常存在复杂的交互关系,通过建立不同变量域中的特征关系可以直观地的展示不同变量间的相似性和不同之处。在该工作中,我们基于合并树分别提取不同变量域中的主要特征及特征之间的层次关系。通过定义特征之间的相似性建立特征间的关联关系,从而合并不同变量域的层次特征树构建特征网。我们设计了新颖的布局方式在高亮相关特征的同时保持特征之间的层次关系,结合多个关联视图和多种交互方式,使特征网作为指导数据中特征探索的导航工具。