基于语义理解的文本相似度算法

来源 :大连理工大学学报 | 被引量 : 0次 | 上传用户:rgr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.
其他文献
考虑到实际金融市场的不完备性以及收益率分布的厚尾性,基于经典Black-Scholes模型并运用函数的下凸性,期权定价公式H(a)=E[(X-a)2]被推广为Hk(a)=E[(X-a)2k].通过DJSH(道琼
初步配制了PVA纤维水泥基复合材料,对使用原材料的性能、投料顺序和搅拌工艺进行了详细的描述;测定了各个配比的坍落扩展度,揭示掺加纤维后流动性减小的原因是由于PVA纤维有
<正>"同质化",在新闻媒体中是指产品内容的来源、含量、品质基本雷同,选择内容的标准、视角、价值大同小异,产品载体的版面、画面、外观几无区别,千报一面,创新乏力,使得受众
本文使用Hummels和Klenow(2005)二元边际分解法,对2000-2013年中国农产品HS-6分位贸易数据进行分解,结果表明中国农产品出口增长主要来自集约边际的贡献,但扩展边际也发挥重
目的:探讨中西医综合疗法治疗难治性神经根型颈椎病的临床疗效。方法:将120例患者随机分为2组,每组60例。对照组采用推拿、牵引、理疗、药物等传统方法治疗,治疗组采用神经阻
经济发展的主要动力是科技创新,知识产权保护则是科技创新的主要保障,所以必须充分发挥知识产权制度在经济发展中的重要作用,这是提高社会生产力和综合国力的必然要求。在地
<正>刘春莹主任医师从事肾病临床、科研、教学20余年,长期致力于中西结合肾病研治,她医术精湛,学验俱丰,尤其对肾性水肿的证治,积累了丰富经验。现将刘春莹主任医师治疗肾性
二战后,随着国际人权法的逐步确立,人权的国际保护越来越受到国际社会的普遍关注。虽然目前有国内保护和国际监督两种途径来实现人权的国际保护,但在实践过程中仍出现了诸多
电动汽车由于车内装有高电压的动力回路,所以相对于传统汽车,在碰撞中需要考虑的电气安全问题更多。本文分析了国内外电动汽车碰撞标准和法规,研究了电动汽车碰撞试验方法;并
近年来,粤港两地的偷渡犯罪形势较为严峻,在偷渡的方式、偷渡的流向,以及偷渡的组织等方面,呈现出了一些新的特点。当前粤港两地的反偷渡工作面临着打击海上偷渡难度大、反偷