基于语义词语相似度计算模型的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sunapi1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在智能信息处理中,基于语义的词语相似度计算是一个非常基础而关键的问题,广泛应用于信息检索、机器翻译、自动问答系统、文本挖掘等领域。词语相似度计算的算法有很多种,大部分算法都缺乏词语间各种关系等因素的分析,因此对相似度进行量化时,导致词语相似度计算结果不够精准。本文基于哈工大信息检索研究室开发的《同义词林》,根据《同义词林》的结构信息和词语划分的各种规则,综合考虑了词语间关系、词语在词林中分布区域及词语的语义相关性等信息,分析了它们对相似度的影响,提出并实现了一种基于语义的词语相似度计算算法。为了验证算法的合理性,本文通过三种不同的方法对算法进行实验验证,并与中科院计算所刘群先生提出的基于《知网》词语相似度计算的算法进行了比较分析。从三个方面对本文提出的算法进行测试,包括词语可替换性分析、词语相似性统计分布实验分析和相同词库同义词统计分析。通过比较分析了这两种算法的合理性及准确性。实验结果表明,本文提出的基于语义词语相似度计算方法是行之有效的。这一课题的研究及其成果对于智能信息处理中的多种领域,都将具有一定的参考价值和良好的应用前景。
其他文献
排课任务在学校教务管理工作中尤为重要,甚至相当复杂棘手。如何根据所要开设的课程,遵守一定约束条件,充分有效地利用有限的教师队伍和学校教学资源,按照时间、空间不冲突原
虚拟作物以作物器官、个体和群体的形态结构为研究对象,在计算机上以可视化方式模拟作物在三维空间中的形态结构变化规律及生长发育过程,是对作物生长模拟的进一步深化和拓展
近年来,随着生物信息技术的高速发展,脑电波及信号处理已成为脑科学和神经信息学的重要研究方向。脑电波作为一种微弱的生物电信号,经过脑电设备的采集,如何从携带噪声的脑电
近年来,随着计算机视觉的发展,人脸识别技术成为模式识别领域非常热门的一个研究课题。人脸是人类非常重要的生物学特征之一,人脸中包含了很多重要的信息,例如身份、性别、年
字符串匹配算法一直是计算机科学的研究热点,尤其是信息时代数据爆炸式的增长对字符串匹配算法的性能提出了更高的要求。在信息安全领域中,关键字规模大,实时性要求高、匹配
随着嵌入式技术的高速发展,软件开发的规模也日益扩大,其开发成本也随着软件开发的周期增长而越来越高。为了提高软件开发效率,只有在开发过程中采用创新的方法。为应对新的需求
基于无线通信的列车控制(Communication Based Train Control, CBTC)的列车自动监督(Automatic Train Supervision, ATS)系统主要实现对列车运行的监视与控制功能,通过ATS的
网络规模的飞速发展和宽带技术的广泛应用,使得互联网传输数据的流量以非常快的速度递增。大量的数据交换对互联网的核心设备一路由器的性能提出了越来越高的要求,尤其是要求
随着计算机技术与图形学的迅速发展,计算机动画已经被广泛应用到影视制作、游戏动画、广告、医学及教育等领域。运动捕获技术以其无可比拟的真实感和后期编辑技术的强大性成为
无线传感器网络作为21世纪具有重大影响力的技术之一,成为自动化技术研究领域的研究热点。工业无线传感器网络是在传统无线传感器网络基础上发展而来的,除了具备无线传感器网