中文文本释义判别的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:lws8228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本释义判别指判断两个文本是否表达相同的含义。文本释义判别是机器翻译、信息检索、复述问题和自动问答等研究领域的基础,是自然语言处理的重要技术和基础研究。本文以深度学习框架下的中文文本释义判别为研究对象,以提升文本释义判别的性能为研究目标,研究了释义语料的构建、中文词语相似度计算和文本的释义判别模型。本文主要从以下三个方面进行研究:针对目前中文文本释义判别任务中缺少释义语料、现存的释义语料可读性差和释义程度不高等问题,本文提出质量可控的释义语料构建方法。CTSC-19释义语料库是在Sougou T-16语料库上选择将要进行释义改写的文本,然后使用众包技术对已选择的文本进行释义改写。为监测语料制作者构建语料的行为并监督语料构建的质量,设计了中文释义判别语料库构建系统。最终构建的CTSC-19释义语料库已应用在第八届全国社会媒体处理大会的2019文本溯源评测中。针对现有中文词语相似度计算研究没有充分利用汉字中音、形、义这三大要素来进行词语相似度计算的问题,本文提出基于音形义的词语相似度计算模型。该模型使用词的分散表示,学习汉语中字、偏旁、拼音的分散式表示,然后交互的计算这些汉语构成要素的语义相似度,最后利用岭回归模型融合这些相似度,从而得到词语的相似度。在Word-Sim297数据集上的实验结果表明,该模型优于CBOW模型和Skip-gram模型等基线方法。为在释义判别中利用语言学特征,本文提出了融合句法与语义的中文文本释义判别模型,该模型引入文本的句法特征获得具有句法结构的文本语义表达,使用句法信息来增强文本的语义表达,在句法结构上学习文本的语义表示,并通过卷积神经网络提取有效的释义关系特征,把提取的特征与传统特征进行融合,通过多层神经网络对文本进行释义判别。在PSP数据集上的实验结果表明,该模型取得了更优的F1-score值,证明该模型的有效性。
其他文献
目的:观察传统名方治疗滑胎的疗效。方法:采用安奠二天汤加减(党参、白术、山药、熟地、山萸、阿胶等)治疗72例。结果:治愈70例,无效2例,总有效率为97%。结论:本方有脾肾双补
对三相异步电动机故障现象进行全面分析,并提出相应的判断故障产生的原因,为在生产过程中准确地确定事故性质,从而及时排除电动机故障。
<正>情志致病是中医学中具有鲜明特色的病因学思想,也是中医学具有生物-心理-社会医学模式的证据之一。其中情志病因致发疾病,成为后世医家关注的重点。因此,形成了以《内经
会议
目的:观察应用中药灌肠治疗妇科盆腔脓肿术后腹痛、低热的疗效。方法:对124例盆腔脓肿术后患者随机分为两组,对照组56例以西药抗生素治疗为主;治疗组68例在对照组治疗的基础
目的:观察辨证施治联合抗精神药物治疗抗精神病药所致肥胖的疗效。方法:采用辨证施治临床分为气虚型、气血亏损型和痰湿阻滞型,治疗本病46例。并设42例对照组单纯采用抗精神药物
目的 探讨舒适护理在骨科手术中的应用效果。方法 择取我院88例骨科患者的临床资料作为研究对象,随机分为治疗组(44例)和参照组(44例),给予治疗组舒适护理干预,参照组则进行普通