论文部分内容阅读
随着装备论证数据工程建设的推进,各类型装备及其论证相关综合性数据不断丰富完善,数据规模不断增长。大数据时代的背景下,数据挖掘、辅助决策系统等大数据应用分析技术不断走向成熟,为在数据工程前期成果的基础上,进一步发挥装备数据的潜在价值提供了可能。本文研究的重点是大数据背景下装备数据的表达方法,并通过物化视图技术,研究物化视图选择算法,提高基于装备多维数据集的数据查询效率。首先,分析装备数据特点,结合装备管理业务实际,设计了基于“装备全寿命管理”主题的多维数据模型,从概念模型和逻辑模型两个方面详细描述了设计过程,分析了多维数据集在数据表达方面的优势。其次,采用物化视图技术提高数据查询效率,在多维数据集的基础上,分析比较了经典物化视图选择问题模型的优缺点,选取数据立方体模型研究维护更新开销受限的物化视图选择问题。在经典线性代价模型的基础上进行改进,给出了查询代价、视图物化收益、维护更新开销的定义。提出了基于布谷鸟搜索的物化视图选择算法,并分别在TPC-DS数据集和装备多维数据集上进行实验,验证了算法求解物化视图选择问题的良好性能,体现了算法的普遍适用性和解决实际问题的能力。