XML数据智能管理若干关键技术研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:dlfb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海量XML数据的涌现与传递,XML已成为互联网上信息表示和数据交换的一个重要标准,继而产生了对XML数据管理的需求,如何有效地表示、查询与挖掘这些XML数据已经成为当前XML数据管理领域遇到的一个重要挑战。针对目前XML数据管理研究现状中存在的问题与不足,本文研究了XML数据模型、群体智能、模式识别、神经网络、数据挖掘与智能计算等原理与方法,在原型系统XBASE上提出了一系列基于XML键的数据清洗、查询、数据挖掘等新的智能管理方法,同时探讨了XML重构的有效途径等问题。本文围绕XML数据的查询与数据挖掘等智能管理问题展开研究,研究内容和取得的成果主要体现在以下四方面:1.XML数据管理框架—XPDM的建立现有的XML数据模型存在着四个问题影响了XML数据的有效管理,即:(1)数据的异构:给多数据源集成带来许多困难,影响了信息查询的有效性;(2)数据的非一致性:由于数据约束的不完整性,常导致数据前后不一致,影响数据查询的准确性;(3)多数据源之间数据依赖关系的不确定性:影响数据之间的归并与查询;(4)语义标准的规范:由于XML正处于发展之中,许多规范还不完善,往往导致了查询语句的繁琐与混乱。针对以上问题,本文提出了一种以XML键构建的向量空间模型为基础、利用概率理论进行操作的海量XML数据管理框架—XPDM。该框架通过对XQuery 1.0和XPath 2.0数据模型XDM进行语义规范新扩充及XML数据矢量转换,较好地解决了以上四个问题。2.数据智能清洗与查询策略为了解决XML文档中的“脏数据”问题,通过引入XML键组合及XML向量模型,利用贝叶斯学习方法与马尔可夫链概率转移策略建立XML数据清洗过程的元数据模型,利用XML树相似性判定算法,提出了一种智能清洗XML数据的新方法,通过相应规则库的预定义完成XML数据的清洗;另外为了解决XML数据清洗检测繁锁及灵活性差的问题,提出了通过合理组合XML键、融入粒子群算法、结合隐马尔可夫模型信息抽取策略构建XML数据清洗优化算法;为了提高XML数据查询的智能性与有效性,通过采用启发式方法,结合XML半结构化的特点,将粒子算法与蚁群算法融入到海量XML数据概率查询上,并进行相应改进,实现了数据查询范围的并行处理能力与收敛效率的提高。3.XML数据智能挖掘策略互联网上已聚集了海量的XML数据,为了有效地对XML数据进行挖掘,本文从以下几个方面进行研究:(1)为了提高海量XML文档集的聚类质量,分别以粒子群算法与矩阵迭代自组织算法为基础,提出了基于粒子群的XML自适应混沌聚类算法和基于向量空间模型的矩阵迭代自组织XML辅助聚类算法;(2)为了提高海量XML文档集的并行处理能力,根据混沌原理,融入蚁群聚类算法,通过定义相应混沌适应度函数衡量蚂蚁与其邻域的相似程度,提出了一种基于混沌原理与蚁群聚类模型的XML分片算法;(3)针对XML数据的流动性和无限性等特点及质量检测存在的不足,提出构建XML键的矢量矩阵作为窗口,利用矢量积小波变换多级分解与重构,再结合最小二乘支持向量机构建双滑动窗口进行XML数据自适应监测算法,满足对XML数据进行网络传递的质量管理要求。4.XML智能重构策略为了更好地优化XML的语义规范,解决随着用户需求的变化以及时间的推移、XML数据结构也会发生变化这一问题,对XML重构进行了探测性研究。在XML文档片段重构的基础上,利用XML语义约束关系及XML路径层次性,再结合向量机原理与频繁模式的特点,提出了XML频繁模式树XFP-tree算法进行XML结构重构策略,有助于进一步保证XML的质量。
其他文献
随着信息技术的快速发展和广泛应用,信息系统正在逐渐从低级向高级、从孤立封闭向开放协同、从简单向复杂发展。这就要求信息系统的组成单元具有智能性和自适应性,这种单元被
图像融合是指通过特定算法将工作在不同波长范围、具有不同成像机理的图像传感器对同一场景的多个图像信息融合成一个新的图像,从而克服单一传感器图像在几何、光谱和空间分
在牛津英语新教材的应用中,教师应根据英语课程标准和学生实际情况,注重整体意识;把握课时之间的环节;在准确地把握总的教学三维目标和教学重点和难点的前提下,改变思维方式,提高英
现代景观设计集艺术、自然科学、社会科学等学科领域的理论于一体,旨在对自然环境和人工环境进行规划探究,随着环境问题的日益突出,现代自然的居住区景观设计逐渐受到了人们
《论文集》、《茶话新说》出版感赋 十年求索为谁忙?冷水沏茶漫漫香。 品得壶中真起后,再邀红叶赏重阳。 1999年仲秋于北京采韵斋七绝@陆尧!北京 “Proceedings”, “a new sense
期刊
【正】 鲁迅一生对于革命文艺事业作出了巨大贡献,他为整个中华民族的文化开辟了崭新的方向。不光在小说、杂文、翻译等方面有着光辉的成就,就是对于中国古典文学的整理研究
期刊
目的探讨选择性痔上黏膜切除钉合术对内痔的临床疗效。方法选取本院肛肠科2016年5月~2017年6月期间收治的86例内痔患者为研究对象。根据不同手术方法将患者分为对照组和观察
以北京市民端午节放假期间的活动日志为基础,通过微观调查,揭示了北京市民端午节期间休闲行为的一般时间特征及年龄、性别等因素对其休闲行为的影响。 Based on the diary o
随着科学技术的发展,信息融合已成为当前科学研究中的一个热点。由于其已在军事和民用领域展现出了广阔的应用前景,而备受国内外众多学者和专家关注。虽然目前已经提出了许多关
新疆某水利工程坝基为砂砾石基础,主要通过振冲碎石植对其加固处理。本文结合工程泄水闸坝基加固方案,着重介绍了振动沉管碎石桩施工工艺、施工方法和施工过程中的质量控制。