【摘 要】
:
如何准确快速地在互联网上获取信息已成为现在的研究热点。目前的大部分搜索引擎是根据用户输入的关键字组合进行词串匹配,返回大量网页,准确率低。在信息检索中,根据用户的
论文部分内容阅读
如何准确快速地在互联网上获取信息已成为现在的研究热点。目前的大部分搜索引擎是根据用户输入的关键字组合进行词串匹配,返回大量网页,准确率低。在信息检索中,根据用户的查询输入,准确地理解用户的查询意图,是提高搜索结果准确性的关键所在。用户的真正意图是一个整体,表示一个完整的概念。分析用户需求,就是将形式上离散的输入,还原成用户的完整的原始的需求概念。以此概念为指导,可以预期大幅提高搜索效果。本文对语段形式的用户需求进行分析,这种形式的需求在用户查询日志中出现最多。本文通过概念图来表示需求概念,用节点表示概念,用弧表示概念间的关系。首先人工总结出几个常见的查询领域类别,标注出各查询类别的概念框架图。然后对查询进行预处理:利用搜索引擎进行粗切分,再用基于网络挖掘技术训练得到的若干复杂专有名词识别器,对切分后的结果进行识别。我们用专有名词识别和规则匹配的方法来将用户的查询进行归类,并识别出用户需求中含有的相应类别的属性的值,填充到该类别的概念框架图中。由此得到用户需求的概念图。本文收集了搜索引擎日志中大量出现的若干类别的用户查询实例,对系统的有效性进行测试。实验结果表明,对特定的若干类别的查询输入,系统有着较好的分析结果。
其他文献
随着嵌入式设备硬件条件的提高,嵌入式系统对于轻量级GUI的需求越来越迫切。在近几年涌现了很多嵌入式GUI系统,然而它们虽然结构严谨,功能强大,但是体积过于庞大,对硬件设备
自动程序设计是软件工程师的梦想。随着人工智能、认知科学的理论研究发展,以及人们在软件生产领域的实践,一些特定领域的、自动、半自动程序设计系统已经出现。自动程序设计
虚拟现实是当前国内外科技界研究热点之一,它利用计算机技术生成一个逼真的虚拟世界,让用户体验身临其境的感觉。众多虚拟现实技术中基于图像绘制(Image-Based Rendering,IBR
公平不可否认协议可以保证通信双方对各自的行为不能进行抵赖,并保证双方的公平性。它使通信双方要么都收到消息及证据,要么都收不到消息及证据。该类协议是电子商务协议的基
虚拟现实是一种高度逼真地模拟人在现实世界中视、听、动等行为的人机界面技术,因其能够帮助人们建立一个具有身临其境的沉浸感、能与复杂系统进行交互、并能促进构想与创造
随着嵌入式系统的应用越来越广泛,尤其是与Internet的结合,其作为信息和资源结点的功能越来越明显。以往,系统设计师们仅仅把其安全性当作附加的特性设计到系统中,如加密算法、安
随着计算机联网的逐步实现,Internet前景越来越美好,全球经济发展正在进入信息经济时代,计算机信息的保密问题显得越来越重要。密钥交换是通信双方建立共同的加密材料的过程,
随着社会的高速发展,信息技术的发展也达到了一个新的高度。人们越来越重视信息的共享与有效信息的高效获取,这就要依靠有效的信息表示和管理。在庞大的信息面前,人们更加努
人脸检测是近二十年来研究较热的领域,其功能是检测图像中的所有人脸。它是任何人脸处理系统的第一步。另外,它本身有着广泛而重要的应用,包括基于内容的图像检索、安全认证