论文部分内容阅读
汉语句子相似度计算在中文信息处理的各个领域中都占有重要地位.通过对编辑距离进行有效扩展,提出了一种衡量句子相似度的定量计算方法和对应的多项式时间算法.该方法以词取代字符作为基本的编辑单元,基于词汇语义计算替换代价,引入块交换操作计算语义编辑距离,并对距离进行归一化以计算句子的相似度.实验结果表明,该方法的准确率优于已有方法。