论文部分内容阅读
在创新驱动发展的大背景下,科技查新和文献检索等科技咨询服务逐步走向市场化,使得查新工作不仅仅要面临着来自市场严峻考验,而且查新的内涵与服务模式也发生了相应的变化。基于此,更多的检索手段被提出,更多的查新分析方法被投入,服务内容也更有深度。
本文提出了将对抗学习的方法应用到查新检索式的自动生成中,旨在为科技查新服务提供自动化流程。将模型部署到面向自动处理的科技查新系统平台中,实现了依据查新委托单中的查新点自动构建检索策略,查新员可以对自动生成的检索式进行优化和修改以保证检索结果的准确性。在一定程度上解决了领域专家构建检索式所遇到的问题。
本文的研究内容主要有以下几点:
首先,经调研发现领域专家在构建检索式的过程中容易出现两个方面的问题并针对此问题提出解决方法。(1)领域专家在某一个领域是权威的,但如今的科技查新工作大部分是跨领域的。在构建检索式时,领域专家可能会因先验知识储备不足,导致所撰写的检索式不够全面,遗漏或缺少部分关键词使得论文查全率低,进而无法支撑起整个查新工作;(2)所选取的关键词可能存在一词多义现象。消歧问题一直是学术界的难点,关键词词义复杂,在检索结果中关键词不仅出现在目标文献中,也出现在无关文献中,导致查准率较低。
其次,为有效获取对抗学习框架所需要的检索式生成特征,本文对查新资源进行解析并提取查新点。在文本生成相关技术中,向量表示特征与语言模型还存在些许不足,所以为取得优异的实验效果,本文对词嵌入模型与神经网络语言模型分别进行了对比择优实验,使其更好地完成下游任务。为了解决查全率低、关键词不够全面这个问题,本文引入了网络表示学习模型,利用有监督的命名实体识别模型进行概念与关系的标引,并构建知识网络表示体系。
最后,利用对抗学习框架对提取的语义特征、句法特征、位置特征等进行权重学习,通过对生成器和判别器的优化实现了多个特征的运算,并得到一个有效、精准的查新检索式构建模型。本论文利用基于生成对话的对抗训练模型实现了从医学领域中提取符合特定结构的查新点到检索式生成的模型训练,实验结果证明该模型在化学领域、情报学领域等领域也可以得到符合主题的查新检索式。
本文提出了将对抗学习的方法应用到查新检索式的自动生成中,旨在为科技查新服务提供自动化流程。将模型部署到面向自动处理的科技查新系统平台中,实现了依据查新委托单中的查新点自动构建检索策略,查新员可以对自动生成的检索式进行优化和修改以保证检索结果的准确性。在一定程度上解决了领域专家构建检索式所遇到的问题。
本文的研究内容主要有以下几点:
首先,经调研发现领域专家在构建检索式的过程中容易出现两个方面的问题并针对此问题提出解决方法。(1)领域专家在某一个领域是权威的,但如今的科技查新工作大部分是跨领域的。在构建检索式时,领域专家可能会因先验知识储备不足,导致所撰写的检索式不够全面,遗漏或缺少部分关键词使得论文查全率低,进而无法支撑起整个查新工作;(2)所选取的关键词可能存在一词多义现象。消歧问题一直是学术界的难点,关键词词义复杂,在检索结果中关键词不仅出现在目标文献中,也出现在无关文献中,导致查准率较低。
其次,为有效获取对抗学习框架所需要的检索式生成特征,本文对查新资源进行解析并提取查新点。在文本生成相关技术中,向量表示特征与语言模型还存在些许不足,所以为取得优异的实验效果,本文对词嵌入模型与神经网络语言模型分别进行了对比择优实验,使其更好地完成下游任务。为了解决查全率低、关键词不够全面这个问题,本文引入了网络表示学习模型,利用有监督的命名实体识别模型进行概念与关系的标引,并构建知识网络表示体系。
最后,利用对抗学习框架对提取的语义特征、句法特征、位置特征等进行权重学习,通过对生成器和判别器的优化实现了多个特征的运算,并得到一个有效、精准的查新检索式构建模型。本论文利用基于生成对话的对抗训练模型实现了从医学领域中提取符合特定结构的查新点到检索式生成的模型训练,实验结果证明该模型在化学领域、情报学领域等领域也可以得到符合主题的查新检索式。