基于语义理解的智能搜索引擎研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:william1212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于自然语言理解的搜索引擎模型。它的核心技术是基于自然语言理解的相关技术,包括从关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。
其他文献
针对多重触控技术中的多触点遮挡难题,提出一种基于四路摄像头协同的多触点定位方法。该方法利用矩形交互区四顶点处的四路摄像头同步获取交互区图像,检测目标触点,根据光的直线传播原理和交互区尺寸参数约束构建四条代表触点方向的直线,最后拟合四条直线交点定位出触点位置。实验证明,该方法能有效解决多触点遮挡问题,可支持任意多个触点的精确定位,而且成本低,安装方便,易于移植。
提出了一种在线测量冷凝器污脏的新方法。该方法选取传热端差作为研究对象,运用对角递归神经网络建立变工况端差模型,成功分离出冷凝器污脏对端差的影响,准确实现冷凝器污脏程度的在线监测。根据此方法,研制了以数字信号处理器为核心的测量装置,并进行了现场试验,试验结果证明:该方法有效、可行。
为了实现投标者的身份匿名,给出了一个基于RSA函数的M+1电子拍卖方案,任何投标者不能否认所投的标书,未中标价不会被泄露。该方案执行开标算法至多需要P轮交互,至多2p log 2t次模
支持向量机(SVM)是一种基于结构风险最小化原理、具有很高泛化性能的学习算法,为小样本、非线性、高雏数一类信息融合问题的建模提供了一种有效的途径。本文将Mobile Agent运用
在大中型医院,免疫组织化学检测在临床病理诊断中已成为重要的辅助手段,对疾病的确诊、治疗方案的确定及预后评估等非常重要.免疫组织化学切片质量的好坏直接影响结果的判断.
基于生物网络平台,提出了一种E-service工作流突现方法。生物实体(具有免疫行为的移动Agent)代理Eservice,构成一个自治的单元,通过分布感知确认服务关系,生物实体协商和演化完成了
简要介绍一种全新的前馈神经网络学习算法——代数算法,以该理论提出者针对这一算法做出的多方面的理论证明为基础,将此算法与传统BP算法相比较,利用其在网络结构和获取全局最优
本文主要研究了隐曲线在行为动画中的应用,提出并进一步研究了隐曲线在行为动画中的任务指定作用。提出了基于隐曲线的速度插值算法。隐曲线用于指定行为动画的运动路径,速度曲线用于描述运动的时间分布。基于角色的运动路径和运动速度,速度插值技术生成与速度映射的插值位置点,进而通过逆向运动学技术,可以求解得到动画角色的骨架序列。同时对本文提出的隐曲线速度插值算法进行了实现和分析。通过设置不同的运动路径和速度曲线
指纹图像分割在自动指纹识别系统中发挥了非常重要的作用,有效的分割不但可以减少后续处理的时间,而且可以大大增强特征提取的可靠性,提高系统识别的准确性。主要做了两个方面的工作:提出了一种称之为有效点聚集度的新的指纹图像分割特征;依据有效点聚集度及文献[1]中提出的块聚集度特征,提出了一种有效的指纹图像分割方法,该方法首先采用有效点聚集度对指纹图像做粗分割,然后对粗分割结果采用基于迭代的方法进行后处理,