【摘 要】
:
随着Internet的飞速发展,信息内容空前庞杂,通用搜索引擎已经很难满足特定领域的信息检索需求,垂直搜索引擎应运而生。然而,现在流行的垂直搜索引擎多在语法级层面进行操作,
论文部分内容阅读
随着Internet的飞速发展,信息内容空前庞杂,通用搜索引擎已经很难满足特定领域的信息检索需求,垂直搜索引擎应运而生。然而,现在流行的垂直搜索引擎多在语法级层面进行操作,查询结果不够理想。基于本体技术的搜索引擎能够在语义级层面进行处理,弥补了一般搜索引擎基于关键字匹配的不足。
本文结合“七步法”,构建了电子产品领域本体;然后,提出了一种基于本体的垂直搜索引擎系统模型,分别对其中的概念相似度计算、主题爬虫、关键词提取(主题词索引)、语义查询扩展进行了详细的研究:针对传统相似度计算的片面性,提出了一种综合的概念语义相似度计算方法;扩展Crawler4j爬虫,实现主题爬行;针对传统的全文索引技术的不足,采用一种改进的基于语义的主题词提取算法,提取网页的主题词,分别对网页内容和关键词建立索引,实现基于语义的主题词索引;使用Jena API,实现了基于领域本体的查询扩展。最后,基于J2EE架构,设计并实现了基于本体的垂直搜索引擎的实验系统。实验结果表明,该系统基本能满足领域信息的检索需求,比传统的基于关键字的搜索引擎系统更智能、更精确。
其他文献
立体匹配是计算机视觉研究领域的热门课题,也是立体视觉中最为关键和困难的一步。它的最终目标是得到匹配图像的视差图。立体匹配问题通常可表达为求全局能量的最小化问题,首
肺癌是目前对人类健康和生命威胁最大的疾病之一。CT扫描已成为肺癌的早期检测和诊断的主要手段,基于CT图像的结节检测和良恶性判别也成为国内外研究的热点。识别肺结节的特
P2P技术在资源的整合与利用方面有着独特的优势,但对等实体行为无约束的工作模式可能影响P2P应用的普及,为此业界引入信任机制来约束P2P用户行为。作为信任机制的选择依据,信任
随着互联网技术与应用的迅速发展,Web服务作为一种新兴的Web应用模式及远程访问标准,很好地解决了异构平台上的数据和应用的整合与共享问题。但是,传统的Web服务缺乏语义信息,语
数字农作系统是数字农作技术研究的核心。近年来,随着计算机和3S技术的快速发展,数字农作系统的研制更加趋于综合集成。然而,当前作物模型应用系统及作物模型组件的开发往往采用
肿瘤是目前危害人类健康乃至生命的重大疾病之一,它的发生发展与受损DNA上基因的异常表达密不可分,然而利用基因芯片技术测量得到的成千上万个基因的表达水平中,仅有为数不多
近年来,随着多媒体以及网络技术的飞速发展,基于内容的视频应用得到了人们越来越多的关注,成为数字视频技术乃至计算机视觉领域的一个研究热点。这些应用包括基于内容的视频
随着多核系统的普及和发展,中央处理器的数目越来越多,软件应用规模也越来越大,对存储器的存储容量和访问速度要求逐渐加大。另一方面,随着工艺的发展,作为主流的DRAM和SRAM的工艺
随着嵌入式技术的发展, GPS移动导航产品在汽车电子技术行业得到了广泛的使用。但由于常见移动导航终端功能较为单一,不具备多媒体功能,使其很难满足市场上对人性化导航终端
伴随汽车社会的临近,机动车数量的不断增加,机动车驾驶员的数量也在快速增长,交通安全问题日益成为社会发展的重要影响因素。在交通管理中数据库技术已经获得了普遍的应用,经