论文部分内容阅读
本文以时态数据库为主要研究对象,对不确定时态数据进行了重点研究。时态数据库应用范围广泛,涵盖了包括医疗、证券、多媒体系统、人工智能、历史信息管理、数据库信息管理等不同领域。通过研究发现,虽属于不同领域,但无一例外都要使用时态数据库中的不确定时态数据,尤其是有效时间不确定的时态数据及它们之间的密切的联系无法确定。本文以此为目的,以医疗数据为例,对不确定时态数据的建模、查询及挖掘等问题的解决展开了研究与探讨,其主要贡献如下:(1)提出了基于概率的不确定时态数据模型,BPTM(Temporal model based onprobability)。本文通过分析现有的不确定时态信息模型并借鉴Snodgrass提出的概率方法,设计了基于概率的不确定时态数据模型BPTM。该模型将原有的一些谓词功能进行扩展并重新定义,不仅支持不确定时态信息的表示,而且通过概率表达了不确定时态信息之间的关系。(2)对BPTM模型中的模糊度参数进行修正。模糊度的取值是由用户根据所在领域的经验赋予的一个0~1之间的实数。实际上,每个用户的经验都是有差异的,因此查询出来的结果也会具有差异性。为了让用户最终获取的信息更具有普遍性和实用性,首先由用户输入模糊度初值,然后使用贝叶斯分类器对模糊度进行修正,使得用户最终得到的查询信息更具有现实性和实用性。(3)提出了一种基于离散粒子群优化的医疗数据挖掘算法(PSO-BNB)。通过对已有算法的属性选择过程的对比总结,并针对医疗数据的数据量庞大且表征不明显等特点,提出了使用离散粒子群优化解决属性选择过程的方法来提高医疗数据的分类精确度。首先,将医疗数据离散化;然后,使用基于PSO的wrapper方法对离散后的数据集进行属性选择,并对选择后的属性子集应用贝叶斯分类器进行训练。实验结果表明,该算法具有较高的分类精确度。(4)在BPTM模型的基础上,解决了如何在关系数据库系统中表示不确定时态信息及如何查询并挖掘出这些不确定时态信息之间的关系。根据目前医疗领域对支持存储和处理不确定时态信息的需求,本文将时态数据库技术和BPTM模型运用到医疗领域中,通过在传统关系数据库中构建时态模块解决了时态信息的存储与表示,并实现了对其的查询检索,同时用概率方法和PSO-BNB算法对时态信息进行了挖掘。