个人数据空间管理系统中数据抽取及语义关联构建

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:cbladerunner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着用户需求的增加及信息技术的发展,用户面对的数据形式种类繁多,从单纯的文本文件到图片、音频及视频,从无结构数据到半结构化数据、结构化数据,此外,需求的增加也使用户的数据逐渐呈现海量的特性。传统的数据库管理系统不能满足海量、异构数据的管理需求,数据空间作为一种新的数据管理技术应运而生,它不依赖于严格的数据模式,并采用逐步集成的构建方式,能够满足日益复杂的数据管理需求。本文研究数据空间管理系统的信息抽取以及语义关联的创建,主要工作如下:1.在云环境下实现各种异构数据源的信息抽取。本文研究来自本地文件、关系数据库、电子邮件以及浏览器等数据源的相关抽取技术,对抽取获得的数据信息统一采用扩展的iDM模型进行组织,以弱化不同格式的文件在逻辑表示时的差异性。2.系统预定义和用户自定义的语义关联规则的创建。为提高数据空间的查询效率,利用语义关联对查询进行扩展是一种有效策略。本文实现了系统预定义和用户自定义的语义关联,系统除预先设定的语义关联外,允许用户根据需求创建新的语义关联,从而提高了查询结果的有效性。实验结果表明:当数据量满足某个界限值时,云环境下信息抽取的执行效率要远远高于非云环境下的执行效率,并且数据量越大,云环境的高效性体现得越明显;同时,语义关联的创建,很好地改善了数据空间查询的有效性。
其他文献
目前,工作流技术已经成为现代化企业实现过程管理和过程控制的一项关键技术,越来越多的应用系统集成工作流管理系统,实现协同工作、业务系统集成、过程管理,提高应用系统适应
无线传感器网络作为一种新型的无线网络,为人们与周围环境的自主交互提供了新的平台和解决方法,在军事、环境、医疗、商业等领域都具有广阔的应用前景和很高的应用价值。但是
微博客在线社会网络作为互联网应用新宠,以其便捷、即时、多样化信息传播特点受到了国内外网民的普遍青睐,它非常高的传媒价值得到了社会的普遍认可,尤其是在热点事件传播过程中
群智感知是一种新的计算和感知模式,它主要是利用了移动智能设备的感知、计算、存储和通信功能,通过将移动用户随身携带的移动智能设备看作是一个个功能强大的、智慧的无线传
随着社会和经济的不断发展,人们对身份鉴别在准确性、安全性与实用性方面提出了更高要求。传统基于所有物或所知物的身份鉴别方式存在易丢失、携带不方便、易被遗忘、易被修
随着信息技术的高速发展,面对复杂的业务和大量而分散的数据库积累的数据资源,我们应该怎样有效地管理和重组数据资源呢?怎样找出有价值的信息以供决策使用呢?这些是企业信息
据统计目前互联网上电子商务网站提供的商品总数达到10亿以上,而目前已有的购物搜索引擎对用户的查询只是按相关性返回大量的结果,并没有对众多的结果进行有效的组织和归类,
随着互联网和电子商务的飞速发展,应对复杂多变的企业信息管理系统的开发,传统的业务流程设计已经不能满足现在的需求。先前的业务流程管理显现出一些弊端,那就是缺乏柔性和
P2P (Peer-to-Peer)网络是目前的研究热点,在现实中取得了广泛的应用。P2P不同于传统的基于C/S(客户机/服务器)模式的网络,强调加入节点的逻辑对等关系,网络中的每个节点既可
随着计算机技术、通信技术和网络技术的不断发展和应用,各行业信息化的进程不断加快。对于渔业管理部门来说,传统的以纸质材料为主要处理对象的工作方式越来越不能符合时代的