论文部分内容阅读
随着政企信息化建设的深入,各行各业都形成了极具价值的专业领域信息源。当前基于关键字的搜索引擎技术在通用信息检索中已经取得了很好的应用成果,然而,在面向专业领域时依然缺乏对该领域深入理解的能力,因而导致其在面向专业信息领域的搜索中不能提供满意的结果。
通过本体支持语义,支持人机之间的交流,从而实现机器智能,为搜索引擎的发展带来了新的契机。论文在分析现有语义搜索方法特点的基础上,结合本体论的相关知识,对领域本体搜索引擎的架构、查询扩展、文档标注等关键技术进行了深入地研究。
论文的主要工作如下:
1、面向电子商务的领域本体的形式化描述方法
论文以电子商务为研究对象,根据电子商务检索中强调属性和关系的特征,给出了该领域本体的形式化定义、概念的推理方式以及领域本体的描述方法。
2、基于领域本体的关键字语义查询扩展方法
针对查询扩展可能导致检索效果下降的问题,分析了当前主要查询扩展方法的特点。通过在扩展查询中以语义扩展特征项代替传统关键字,结合词汇在领域本体树的语义特征,提出了基于领域本体的语义扩展算法。同时,考虑了领域本体树中影响查询扩展权重的因素,对每项语义扩展特征项的权重进行了量化。
3、基于领域本体的文档语义处理算法
针对文档语义处理和领域本体不完备性问题,采用了领域本体中基于模式和基于关系两种方式对文档进行语义标注。在语义标注的同时,通过基于领域本体中定义的关系挖掘新实例来自动扩建领域本体,弥补领域本体的不完备性。
4、面向电子商务领域的语义搜索引擎的应用
将对语义搜索引擎的研究成果和实际应用相结合,根据电子商务的特点设计了面向电子商务领域的语义搜索引擎的架构,实现了面向电子商务领域的语义搜索引擎的核心功能,通过实例验证了语义搜索引擎的有效性。