基于神经网络模型的汉语框架语义角色识别

来源 :山西大学 | 被引量 : 8次 | 上传用户:Eltonxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给定一个句子中的目标词,语义角色标注(Semantic Role Labeling)的任务是自动识别该目标词所支配的所有语义角色并标注角色的类型在自然语言处理中语义角色标注是浅层语义分析(Shallow Semantic Parsing)的重要环节,在机器翻译、信息检索、自动文摘等领域有着广泛的应用语义角色标注通常情况下可分为角色识别和角色分类两个子任务。本文只关注角色识别这个子任务。本文基于山西大学的汉语框架语义知识库(CFN),首先将语义角色识别问题形式化为序列标注问题,以汉语的词为基本标注单位,使用神经网络模型来学习,实验中全部采用组块3×2折交叉验证的方法。文献[1]基于深度神经网络模型,研究了汉语框架语义角色的识别。本文在此基础上深入研究了:1)对文献[1]中神经网络模型的过拟合现象,采用加入Dropout惩罚机制与不加入Dropout的神经网络模型的实验结果做了对比。结果表明,加入Dropout的神经网络模型要比文献[1]中模型角色识别的准确率上升了约10%,召回率上升了约1%,F值上升了约6%。表明加入Dropout时可以更好的缓解神经网络模型的过拟合现象,显著提高了模型的性能。2)在神经网络模型的初始输入分别选择词分布表征为Word2vec,NLM,RnnLM来进行实验,结果比初始输入为随机向量时都略有提高,且采用NLM的词分布表征的F值提升约1%。除此之外,本文还研究了词、词性、位置、目标词特征在神经网络模型中表示向量的维数对实验结果的影响,得到这些特征维数分别为100,30,30,40时模型最优;研究了学习率的不同对神经网络模型性能的影响,实验结果是学习率为0.001时神经网络模型最优。本文的主要创新之处是首次在CFN语义角色识别的神经网络模型中引入Dropout的惩罚机制,并结合使用了词的分布表征并进行试验对比。通过实验证明了在神经网络模型中采用Dropout的惩罚机制以及使用词的分布表征对汉语框架语义角色识别作用显著。
其他文献
俗语是广泛流传在民间的通俗语句,是传统黄梅戏语言的重要组成部分。本文对传统黄梅戏中俗语进行了较为全面的描写和分析,包括本体研究、修辞研究、文化内涵研究以及创作研究
测电源的电动势和内阻这一实验是近几年高考的热点,考查的形式种类繁多,但是万变不离其中,其实验原理都是闭合电路的欧姆定律。本文主要以伏阻法、安阻法、伏安法、伏伏法四
肠道寄生虫病就是寄生虫在人体肠道内寄生而引起的疾病,危害性很大,会导致消瘦和严重程度不等的胃肠道症状如腹痛、呕吐、消化不良等。我国是寄生虫病严重流行的国家之一,防
作为广泛应用和备受关注的网络集成技术,无线传感器网络在人们的生活和工作中充当着重要角色,其发展前景也得到国内外工业界和学术界的高度关注。时间同步技术作为分布式网络的
本项研究在青海碳汇现状的基础上,结合青海开展林业碳汇项目的情况,通过文献检索、实验研究相结合的方法对项目边界内的植被、土壤碳库进行初步估测,分析和评价造林和在造林活动
“笑”是人体语言 (态势语 )中的表情语之一。研究人体语言在当前“人类的语言能力正在退化”的形势下更具有现实意义。“笑”的主体信息是欢乐 ,但又能表达各式各样的感情。
浙江省纪委省监委网站日前发表《阿里巴巴:坚持公司诚信文化,打造廉正合规体系》的述评文章称,阿里巴巴能够获得如此飞速发展,除了精准把握市场需求,善于不断创新之外,高度重视清廉
报纸
本文以现有的招投标法律法规作为理论基础,以延长石油T采油厂的招标工作为研究对象,按照招标工作的时间顺序,对招标过程中的主要问题进行研究,讨论确保建设工程招标活动成功
<正>【愿景·意义】"万人乐提拉"首次把互联网与医疗美容机构紧密结合起来,融合了医美专家、医美机构、医美设备厂商、医美互联网APP平台、国内权威媒体、互联网公司以及投融
城市化进程使城市语言调查的研究显得十分必要。城市语言调查的范围涉及各个方面,目前,学术界已经出现诸多多针对城市不同群体语言使用的调查,但还未进行专门针对石家庄市城