基于规则与BP神经网络相结合的复句关系词切分消歧

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yingchaoya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复句关系词是连接复句分句的桥梁,是研究汉语复句的切入点。对复句关系词自动识别的前提是对汉语复句进行正确的分词,而复句关系词切分消歧是复句关系词自动识别的基础。目前使用的分词系统在对汉语复句进行分词以及词性标注过程中存在着很多错误,给关系词识别造成困难。本文的主要目的是针对复句关系词与其他词切分在一起的情况进行研究,对歧义字段进行重新分词,并对分词后的结果进行词性标注,从而完成对切分歧义字段的消歧。文章首先对通过中科院的分词系统NLPIR对复句语料进行分词处理,并对六句式以下的复句语料进行关系词标注以及提取。在提取过程中,对复句语料分词后的结果进行分析,总结出复句关系词切分歧义字段的规律。然后,对关系词与其他词切分在一起的情况进行研究,并对其复句语料进行提取,根据这些复句关系词的特征建立规则,利用关系词本体库以及规则检索出切分歧义字段并对其进行正确切分。最后,通过构建BP神经网络模型,对模型进行训练,提取切分歧义字段的上下文语境词的词性特征以及对词的词性权重进行向量化,映射到神经网络的节点中。通过将误差与期望值的比较,并将误差反传,从而得到合适的权重,实现对词的词性进行标注,达到消歧的目的。在实验过程中,我们选取了七个比较常见的复句关系词,并从CCCS复句语料库提取条复句语料进行测试,切分歧义字段消歧的正确率达到93.4%,从而验证了基于规则与BP神经网络相结合的方法对复句关系词切分消歧的处理是有效的。
其他文献
随着我国经济不断转型升级,原有的要素驱动逐渐被创新驱动所取代。创新越来越成为一个企业乃至国家获取竞争优势的关键。管理层作为战略决策的主体,会对企业创新发展起到至关重要的作用。依据委托代理理论,在经营权和所有权分离的情况下,管理层出于自利主义考虑往往缺乏创新动力。而激励理论认为可以通过对管理层实施激励,使其利益目标与股东相一致,在有效保证企业经营活动的同时,加大对创新项目的支持与投入。目前关于高管激
目的:研究观察瞬时感受电位通道亚家族(transient receptor potential vanilloid4,TRPV4)通道是否参与糖尿病大鼠胸主动脉异常收缩,并对其可能机制进行探讨。方法:(1)选取6周龄健康雄性SD大鼠随机分为对照组(Control)和糖尿病组(Diabetic mellitus,DM);一次性腹腔注射链脲佐菌素(Streptozotocin,STZ,60mg/kg)
计算机视觉伴随着硬件性能与软件质量的提升取得了长足的发展,而行人的检测作为基础也是最重要的任务之一,始终是计算机视觉领域的研究热点。行人检测在智能安防、交通监控、
人脸识别技术作为生物识别领域中最重要的一门技术,已经具有几十年的发展历史了,随着技术的不断成熟已经渐渐的应用到了安全监控、人机交互以及远程教育等多领域中。具有应用
驾驶人姿态识别是车辆辅助驾驶领域中的一个热门研究内容,是人体姿态识别的一个重要实际应用,研究人体姿态识别方法可以对该实际问题提供借鉴。传统的人体姿态识别是以可见光
超短波电台检测设备校准装置是实现检测设备规范化校准、保障检测设备量值的准确可靠、构造标准化硬件平台的关键所在。本文依托于企业所承担的校准装置设备的研制任务,以校
序列信息时刻充斥着我们的生活,随着信息技术的发展,各个领域的序列信息也呈现了爆炸式的增长。在信息时代背景下,如何从这些序列信息中高效的找出对我们有用的信息,成为了序
箱型截面构件由于具有结构力学性能好、双向抗弯刚度大、自重轻等特点,在工业建筑中应用越来越广泛,一些大型建筑企业已基本形成了较为标准的制作工艺,主要涉及下料、组对、焊接,端铣等步骤,常规采用的焊接方法有气保焊,埋弧自动焊和电渣焊。但在核电钢结构的制作上电渣焊技术尚未被应用过,而国际核安全原则中明确要求核电必须采用经过验证的技术。XX公司在一核电项目建设过程中,有一箱型钢结构的制作任务,箱型钢结构内隔
心率是心脏每分钟跳动的次数,心率检测也是评估心脏健康状况的重要手段。已有的心率检测分为接触式和非接触式,其中接触式心率检测精度较高,但需要与皮肤接触、并且使用复杂
相位梯度超表面(Phase gradient metasurface)是由周期性或准周期性亚波长微结构单元阵列组成的新型人工电磁材料。它通过改变子单元结构来控制反射和透射波的相位突变量,在