融合句法信息的句子嵌入表示学习方法及应用研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:zhou101302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言理解是当前学术界和工业界关注的热点问题,也是当前人工智能研究领域面临的最大难题之一。实现语言理解的关键是自然语言的语义表示,它是进行自然语言理解和推理的基础。自然语言有词、句子、段落及篇章等四个层级,词语是最基本的语言单元,而句子则是由词语有机组成的、合符语法的、线性连接的、具有相对完整语义的语言单元,是组成段落和篇章的重要语言单位。与词语有限的语义空间不同,句子的语义并不是词语语义的简单相加,它是在词语语义基础上结合句法作用进行耦合得到,句子语义比词语语义复杂得多、灵活得多。随着当前分布式词嵌入表示在很多任务上的成功应用,人们很自然地想到能否将向量表示法扩展到句子或长文本,即将句子的语义表示映射至低维的连续空间。由于句子语义表达与句法结构密切相关,现有句子嵌入表示学习方法虽能够一定程度上保留句子中词序信息,但不能避免句法结构信息的丢失,难以准确地学习到句子的嵌入表示。针对当前句子嵌入表示学习中由于句法信息缺失导致句子嵌入表示学习精度不足的问题,本文提出融合句法结构信息进行句子嵌入表示学习。论文主要工作包括:(1)提出融合句法信息的句子嵌入表示学习方法,即:对句子进行句法结构分析,将句法信息与词向量融合,学习得到句子嵌入表示。通过与现有方法在中英文不同维度词向量进行句子嵌入学习的文本相似度检测对比实验表明,本文提出的方法在低维词向量上就能获得更好的结果,提高了精度和运算速度,在中文数据集上,精度提升高达5.17%;(2)研究基于句子嵌入表示的科技奖励项目申报文本重复性检测问题,即:使用本文的句子嵌入表示学习方法学习句子嵌入表示,将其应用于科技奖励项目申报文本重复性检测。实验表明,应用本文提出的方法学习到句子嵌入表示能够更好地进行文本重复性检测,该项工作可为科技奖励项目申报文本进行形式审查提供科学的参考依据,也为其它类似的项目申报文本形式审查提供方法借鉴,具有较好的应用价值。
其他文献
员工的业务能力就是企业的竞争力.虽多企业也都致力于提升员工的业务能力!本书作者集在韩国现代集团31年的工作经验和人生阅历.为你提供完美的诠释!
当美联储主席格林斯潘在国会用他含混不清的语言暗示将升息时,中国人民银行行长周小川或许可以长长地吁一口气了。
世通案再次证明了一个关于商业的颠扑不破的真理:“空中楼阁”般的发展模式必然经不住行业起伏的大环境带来的冲击。
采访结束后两个月,奚晓敏辞去了新农化工财务总监。一方面,他需要一个自己的舞台,另一方面,新农化工的公司治理毕竟无法毕其功于一役。
针对无人机施药时有效喷幅受到不同作业条件及外界风的影响,导致作业过程中雾滴重喷率、漏喷率变高的问题,利用雾滴密度判定法在不同高度、不同方向侧风条件下进行单旋翼无人
本文全面分析了新时期大学生特点以及实习面临的问题,结合专业培养目标,提出了工科专业生产实习由传统体力参与到智力参与的实习模式,对大学生在生产实习中参与的环节及参与程度
“现在的时机再合适不过了,我们能下决心启动股权盆改革试点,说明上市公司股票期权激励机制的建立条件已经成熟。”一位专家在接受记者采访时表示,他非常看好这一前景。
在n值R0命题逻辑系统中给出了公式列按真度收敛的定义,研究了公式列按度量收敛、按赋值收敛及按真度收敛的性质,给出了三种收敛各自的充分必要条件,在公式列是有限原子的条件下
期刊