基于Rough本体的手机领域语义搜索引擎的研究与实现

来源 :南昌大学 | 被引量 : 0次 | 上传用户:mxhcxp11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的广泛应用,手机信息化的程度越来越高,基于关键字匹配的手机搜索引擎无法反映Web信息在现实世界中的语义,由此不可避免地导致查准率和查全率低的缺陷;另一方面,目前本体支持的形式化概念还不足以表示不完备知识。因此,在这样的背景下,本文针对目前搜索引擎中存在的问题,提出了一个由资源搜集模块、语义描述模块、语义提取模块、基于Rough本体知识分析和基于本体的SWRL规则相结合的语义推理模块、语义检索/输出模块构成的基于Rough本体的手机领域语义搜索引擎原型系统MPSSE,为用户提供了一种有效获取所需领域信息的新方法。本文研究的主要内容如下:第一,着重研究了语义Web结构中的关键两层:本体和语义Web描述语言——OWL,介绍了语义Web描述语言的结构和语法和Rough理论与本体结合的新概念——Rough本体,以及介绍了基于本体的逻辑推理中的语义Web规则语言SWRL和Jess规则引擎的工作原理,为后续建立领域本体和实现基于Rough本体的推理奠定了基础。第二,通过研究Rough集理论在决策分析领域的应用,提出了一种基于Rough本体知识分析和基于本体的SWRL规则相结合的推理模型。在该模型中,本体被表示成Rough本体的信息系统的形式,利用Rough集工具Rosetta从信息系统中挖掘出潜在的新知识(决策规则),并通过设置支持度阈值和置信度阈值来筛选出较为关键的规则,为手机分类的判断提供了简洁而直接的知识表达。结合Protege以及Jess推理机,利用SWRL创造性地将决策规则转换成推理规则,运用这些推理规则在领域本体库中生成新的知识,将隐含的信息显式地描述出来,为搜索引擎的智能查询提供服务。第三,研究了手机领域本体的内部组织结构,将它的组成元素抽象为概念实体、概念属性以及概念间关系三种类型,通过结合本体的概念蕴涵、属性关联、相互约束以及公理定义,最终形成一个语义关系清晰的网状结构,成为系统在语义和推理上的底层支撑。采用了目前流行的建模工具Protege进行建模,使用了OWL本体描述语言进行形式化描述。第四,探索了语义检索的实现思路,利用B/S模式设计实现了基于Rough本体的手机领域语义搜索引擎MPSSE,并与基于关键字的检索系统Lucene作了比较,试验表明,基于本体的语义搜索引擎系统能有效地提高了系统的查准率和召回率。
其他文献
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互联的开放式系统,入侵检测的问题变得越来越突出。生物免疫系统基本功能是识别自我和非我,
关联规则挖掘的研究一直是数据挖掘领域的研究热点之一。它主要是指在满足最小支持度和最小信任度的条件下,从数据库中挖掘出如“购买物品A和B的客户80%同时也购买C和D”这样
无线Mesh网络是一种与传统无线网络完全不同的新型无线网络技术,它依靠无线链路多跳传输数据,减轻了对有线网络的依赖,更以它频谱效率高、覆盖范围大、可扩展性和可靠性强等优势
随着计算机和网络技术的不断发展,计算机网络的安全问题也日益突出。目前网络安全技术包括路由器、防火墙、漏洞防堵、入侵检测、审计和反攻击等,其中路由器过滤、防火墙、漏
随着互联网应用和电信业务的不断发展,数据库的应用范围越来越广泛,数据库规模不断的扩大,业务复杂程度的增加,系统的性能问题越来越突出,因此对数据库性能优化变得十分重要
随着信息技术的飞速发展,使得万维网中的文本资源呈指数级增长。由于现有技术的局限性,这些文本资源从计算机的角度看,仅仅是一堆乱码,即这些数据是机器“可读”但“不可理解
信息业的高速发展,随之而来的是盗版的肆意泛滥。由于打击盗版,维护数字作品版权的需要,运用数字指纹进行版权保护这一思想已经受到越来越多国内外研究人员的重视,成为国内外
现有的推荐技术中,协同过滤技术的应用最为广泛,使用的推荐效果也很不错。为了达到更精确的个性化推荐,研究者们开始了大量的推荐算法混合使用方面的研究,一些比较好的混合算法从
随着计算机网络与通信技术的发展,互联网高速时效性强的特点使得越来越多的网络设备(安全网关、路由器)对数据包处理速度提出了更高的要求。包分类算法作为这些网络设备中的