融合句法信息的句子嵌入表示学习方法及应用研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户：zhou101302

【摘要】

：

语言理解是当前学术界和工业界关注的热点问题,也是当前人工智能研究领域面临的最大难题之一。实现语言理解的关键是自然语言的语义表示,它是进行自然语言理解和推理的基础。

【作者】

：

陶兰

【出处】

：

华东交通大学

【发表日期】

：

2018年期

【关键词】

：

句子嵌入句法分析词嵌入语言理解语义表示

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言理解是当前学术界和工业界关注的热点问题,也是当前人工智能研究领域面临的最大难题之一。实现语言理解的关键是自然语言的语义表示,它是进行自然语言理解和推理的基础。自然语言有词、句子、段落及篇章等四个层级,词语是最基本的语言单元,而句子则是由词语有机组成的、合符语法的、线性连接的、具有相对完整语义的语言单元,是组成段落和篇章的重要语言单位。与词语有限的语义空间不同,句子的语义并不是词语语义的简单相加,它是在词语语义基础上结合句法作用进行耦合得到,句子语义比词语语义复杂得多、灵活得多。随着当前分布式词嵌入表示在很多任务上的成功应用,人们很自然地想到能否将向量表示法扩展到句子或长文本,即将句子的语义表示映射至低维的连续空间。由于句子语义表达与句法结构密切相关,现有句子嵌入表示学习方法虽能够一定程度上保留句子中词序信息,但不能避免句法结构信息的丢失,难以准确地学习到句子的嵌入表示。针对当前句子嵌入表示学习中由于句法信息缺失导致句子嵌入表示学习精度不足的问题,本文提出融合句法结构信息进行句子嵌入表示学习。论文主要工作包括:(1)提出融合句法信息的句子嵌入表示学习方法,即:对句子进行句法结构分析,将句法信息与词向量融合,学习得到句子嵌入表示。通过与现有方法在中英文不同维度词向量进行句子嵌入学习的文本相似度检测对比实验表明,本文提出的方法在低维词向量上就能获得更好的结果,提高了精度和运算速度,在中文数据集上,精度提升高达5.17%;(2)研究基于句子嵌入表示的科技奖励项目申报文本重复性检测问题,即:使用本文的句子嵌入表示学习方法学习句子嵌入表示,将其应用于科技奖励项目申报文本重复性检测。实验表明,应用本文提出的方法学习到句子嵌入表示能够更好地进行文本重复性检测,该项工作可为科技奖励项目申报文本进行形式审查提供科学的参考依据,也为其它类似的项目申报文本形式审查提供方法借鉴,具有较好的应用价值。

其他文献

《公司要好，员工要强才行》

员工的业务能力就是企业的竞争力．虽多企业也都致力于提升员工的业务能力!本书作者集在韩国现代集团31年的工作经验和人生阅历．为你提供完美的诠释！

期刊

员工公司韩国现代集团业务能力人生阅历工作经验竞争力企业美的

周小川暗战格林斯潘

当美联储主席格林斯潘在国会用他含混不清的语言暗示将升息时，中国人民银行行长周小川或许可以长长地吁一口气了。

期刊

周小川格林斯潘中国人民银行货币政策人民币升值国际收支外汇储备利率市场化

泡沫是怎样破灭的——世通财务丑闻案例分析

世通案再次证明了一个关于商业的颠扑不破的真理：“空中楼阁”般的发展模式必然经不住行业起伏的大环境带来的冲击。

期刊