基于概率的不确定时态数据建模与挖掘问题的研究

被引量 : 0次 | 上传用户:aqcnbbz1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以时态数据库为主要研究对象,对不确定时态数据进行了重点研究。时态数据库应用范围广泛,涵盖了包括医疗、证券、多媒体系统、人工智能、历史信息管理、数据库信息管理等不同领域。通过研究发现,虽属于不同领域,但无一例外都要使用时态数据库中的不确定时态数据,尤其是有效时间不确定的时态数据及它们之间的密切的联系无法确定。本文以此为目的,以医疗数据为例,对不确定时态数据的建模、查询及挖掘等问题的解决展开了研究与探讨,其主要贡献如下:(1)提出了基于概率的不确定时态数据模型,BPTM(Temporal model based onprobability)。本文通过分析现有的不确定时态信息模型并借鉴Snodgrass提出的概率方法,设计了基于概率的不确定时态数据模型BPTM。该模型将原有的一些谓词功能进行扩展并重新定义,不仅支持不确定时态信息的表示,而且通过概率表达了不确定时态信息之间的关系。(2)对BPTM模型中的模糊度参数进行修正。模糊度的取值是由用户根据所在领域的经验赋予的一个0~1之间的实数。实际上,每个用户的经验都是有差异的,因此查询出来的结果也会具有差异性。为了让用户最终获取的信息更具有普遍性和实用性,首先由用户输入模糊度初值,然后使用贝叶斯分类器对模糊度进行修正,使得用户最终得到的查询信息更具有现实性和实用性。(3)提出了一种基于离散粒子群优化的医疗数据挖掘算法(PSO-BNB)。通过对已有算法的属性选择过程的对比总结,并针对医疗数据的数据量庞大且表征不明显等特点,提出了使用离散粒子群优化解决属性选择过程的方法来提高医疗数据的分类精确度。首先,将医疗数据离散化;然后,使用基于PSO的wrapper方法对离散后的数据集进行属性选择,并对选择后的属性子集应用贝叶斯分类器进行训练。实验结果表明,该算法具有较高的分类精确度。(4)在BPTM模型的基础上,解决了如何在关系数据库系统中表示不确定时态信息及如何查询并挖掘出这些不确定时态信息之间的关系。根据目前医疗领域对支持存储和处理不确定时态信息的需求,本文将时态数据库技术和BPTM模型运用到医疗领域中,通过在传统关系数据库中构建时态模块解决了时态信息的存储与表示,并实现了对其的查询检索,同时用概率方法和PSO-BNB算法对时态信息进行了挖掘。
其他文献
正渗透(Forward Osmosis,简称FO)是浓度驱动的膜技术,指水通过选择性渗透膜,从高水化学势区向低水化学势区传递的过程。由于正渗透具有无需外加压力、截留率高、产水质量高、膜
阐述知识经济时代现代企业建成学习型组织的必要性,通过大卫·加尔文提出的组织学习5项方法的分析,指出知识管理系统是实现组织学习的基本工具和建立学习型组织的前提。
民歌,题材广泛,形式多样;具有突出的时代性、纪实性;内容丰富,表现力强烈。民歌能生动体现人民的精神气质和聪明才智,是我国民族民间音乐宝库中一件光彩夺目的瑰宝。民歌之所
目的观察环磷腺苷葡胺联合血液灌流(HP)治疗急性有机磷农药中毒(AOPP)性心肌炎的疗效。方法选择AOPP致中毒性心肌炎患者86例,采用环磷腺苷葡胺联合血液灌流治疗14 d。监测患
首先从案例出发,介绍竞争情报系统的概念,并对其结构进行分析;然后简要地介绍竞争情报系统中信息研究的方法体系,最后对竞争情报系统中信息收集和信息分析这两个重要环节进行
专用无线通信系统经历了常规无线通信,模拟集群无线通信到现在的数字集群无线通信。数字集群无线通信有三种实现方案:一是在北美使用的共用专网系统iDEN;二是为铁路调度需要
自闭症谱系障碍是一类综合性精神发育障碍。自闭症儿童最主要的表现包括缺乏社会交往的能力以及认知功能紊乱。研究发现自闭症患者倾向于避免看其他人的脸,并且对于他们来说
在简要介绍危机概念及其基本特征的基础上,从图书馆危机定义、危机类型、危机成因和危机对策4个方面综述近年来我国图书馆危机研究的现状,并指出研究中所存在的不足,包括实证
在对安徽省内33所本科高校图书馆特色数据库进行抽样调查基础上,分析了高校图书馆特色数据库建设中存在的问题和差距,对特色资源库采取联合共建的模式进行分析,同时从数据规
企业竞争情报系统模式的正确选择与建立是系统成功运作的组织基础,企业应当根据自己的情报需求和特点来决定采取何种模式:分散式、集中式、重点式或独立式等。本文结合国内外