基于混合策略的查询串相似度计算方法

来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:wocaonima3344521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算查询串之间的相似度是进行查询串自动分类和聚类的基础.针对信息检索中用户查询串特点,提出综合考虑查询串中词语的词形、语义、语用三个层面的信息计算查询串相似度的计算方法.首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行
其他文献
网页查重就是将大量网页集合中重复的网页找出来,并加以选择,使用户不用处理大规模重复信息,在节省时间的同时,提高信息检索等的应用效率.快速高效的网页查重算法无论对于采
会议
互联网中大量的重复文本不仅给信息检索带来了诸多不便,而且也是对知识产权的侵犯.本文主要通过实验研究中文文本查重的两个因素:(1)特征字的因素,即分别选取高频字(包括逗号
期刊
本文介绍了传媒语音语料库系统的设计与开发.使用的开发工具是目前在国外较为流行的语言学软件开发工具Tcl/Tk,以及与之配套的语音处理软件包Snack.本文结合传媒语音语料库标
摘要: 人力资源管理就是指对人力资源进行一系列的、不同形式的管理活动。详细来看,人力资源管理指的是在生产过程中,采用科学有效地管理方法,对人力资源进行合理有效的组织和调配,从而能够使人力和物力保持一个最佳的协调关系,最大程度的发挥人力资源的优势,充分发挥人力资源的积极性和主观能动性。创新人力资源管理已经成为实现人才强国战略的关键所在,新的形势对人力资源管理提出了新的要求。本文主要就当前人力资源管理
期刊
本文通过我省人力资源数量、质量、产业分布、流入与经济发展水平关系的计量模型,分析了人力资源与其他生产要素对中原经济发展的贡献,进而认为中原经济区可持续发展必须实施科
期刊
本文讨论了维吾尔语语音合成技术及方法,阐述了维吾尔语的特征及维吾尔语文语转换系统的实现过程.作者从维吾尔语的音系、语音特征出发,研究维吾尔语的语言特点,根据与其它语
汉字笔顺规范是语文现代化建设的一个基础项目.本文以GB13000.1大字集在信息处理实践中遇到的问题为依据,结合实例对现行笔顺规范的规律性问题从部件、笔组、字形和结构等方
本文通过多方面的分析和提出了古维吾尔文(察合台文)文献数字化整理系统构建中,多文种混合处理实现时基于Unicode的标准代码方案和键盘布局.并在此基础上提出了古维吾尔文(察
汉语水平考试(HSK)在十多年的积累中掌握了大量汉语学习者的口语语料,建立汉语学习者口语语料库,能够让这些语料得到充分利用.本文对于汉语学习者口语语料库的建设需求进行了