基于混联电路的复述识别方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yuanCL19861125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复述(Paraphrase),国内的研究者有时也称之为“改写”,顾名思义就是对相同意思的不同表达。复述在自然语言中是一种非常普遍的现象,同时也在自然语言处理(NLP)的应用领域中扮演着很重要的角色,是自然语言处理(NLP)中一个研究的难点和热点,因此现在越来越受到广大研究者的关注。本文的主要研究对象是基于混联电路的复述识别技术。复述识别技术可以实时处理机器翻译中遇到的未登录短语,复述识别技术也能识别自动问答系统中多重问句形式从而提高系统性能,复述识别技术还能在多文档自动摘要系统中用于生成、压缩、相似句子识别等等。本文首先提出了一种新的句子之间距离计算的方法,此方法类似于相似度的计算方法,不同之处在于,电阻距离是计算的值越小,两个句子越相似,而相似度是计算的值越大,两个句子越相似。我们首先把两个句子分别用图G (V,E,co)的方法把它们表示出来,然后我们把这两幅图合并,相同的单词节点V合并在一起,不同的单词节点V不合并在一起,与此同时相应的边E和权重ω也合并在一起,权重ω的倒数即是对应的电阻,其中我们引入了英文同义词词典WordNet,来提高两个句子之间的正确率、召回率和F1值。这两个句子之间的电阻距离就是混联电路总电阻除以合并之后图中的节点总个数,最后我们通过公式优化两个句子之间的电阻距离从而判别这两个句子是否是复述句对。对于此种方法,判断两个句子之间是否为复述句的正确率,召回率和F1值还不够高,所以针对这种方法,我们提出了此种方法的改进方法。我们引入了拉普拉斯矩阵L来改进电阻的计算方法,我们首先还是把两个句子分别用图G (V,E,ω)的方法表示出来,然后把这两幅图合并,然后写出合并之后图的邻接矩阵A和度量矩阵D,则可以得到拉普拉斯矩阵L=D-A,我们再求出L的广义逆矩阵L+,再利用公式计算出每两个节点之间的电阻,其中我们也同样引入了英文同义词词典WordNet。这两个句子之间的电阻距离就是混联电路总电阻除以合并之后图中节点的总个数,最后通过公式优化两个句子之间的电阻距离来判别这两个句子是否是复述句对。最后的实验结果证明了该方法的有效性。
其他文献
随着企业信息化的深入,越来越多的企业流程需求已经无法用普通的办公自动化系统来满足,在激烈的市场竞争中为了适应复杂多变的市场需求,为了赢得市场、获取利润,企业必须建立
作为一种典型的分布式系统,P2P网络的应用越来越广泛。结构化P2P网络基于一致性散列函数,提供节点、对象资源位置在覆盖网中的位置映射,具有良好的查询效率。但是,结构化P2P网络
近几年来,CMOS图像传感器由于其生产工艺兼容、生产成本较低和功耗控制较好等优势,在很多方面获得了快速的发展,广泛应用于手机、PC摄像头、安防监控、条形码扫描器、玩具、
交互行为是人类生活中时刻都在发生的行为,是人类社会中最常见的活动,在日常生活、商贸交易、社会关系、教育教学、政治活动等都有着一定的意义,同时,这也是MAS(多智能体系统
随着计算机网络和多媒体技术的快速发展,基于图像的人脸检测、识别、检索技术已经日益成为特别活跃的研究范畴。其中一个重要的研究课题就是人脸相似度度量,它是人脸检测、识
近年来,随着互联网技术的日益发展和普及,与个性化推荐相关的服务被广泛应用到生活的方方面面。个性化推荐技术不仅能够从海量信息中帮助用户发现想要的内容,而且还能够给商
随着机器学习和物联网技术的快速发展,以及我国的城镇化发展,中国农业正迎来新的发展机遇。利用人工智能技术对农业大数据进行有效挖掘,实现智能农业的有效控制及管理,已经成
随着计算机技术和通信技术的迅速发展,信息安全已经成为信息在传输、存储过程中非常重要的一环,密码学的发展为信息安全提供了强有力的保障,密码学是研究如何隐秘的传递信息的一
多边形填充算法是计算机图形学中的基本算法之一,也是图形加速器中光栅化阶段的主要算法之一。近些年来,随着嵌入式系统的广泛应用以及计算机图形学的发展,面对着嵌入式系统中高
无线传感器网络的快速发展,使得人们在随吋随地使用无线网络资源时,对自身位置信息的需求量不断提高。尤其在室内环境下,能够快速准确的获得移动终端的位置信息变得日益边切。与