【摘 要】
:
句法分析作为自然语言处理中的重点与难点问题,一直广受关注。而组块分析作为浅层句法分析的重要一环,降低了完全句法分析的任务难度。组块分析系统主要是识别句子中的组块信息并对其分类。组块信息可作为中间产物应用到自然语言处理的诸多领域,比如信息检索、信息提取、文本分类、语音识别等等。随着人工智能地普及,深度学习技术已在诸多领域取得丰硕的成果。当然,自然语言处理也是深度学习的用武之地。基于循环神经网络(RN
论文部分内容阅读
句法分析作为自然语言处理中的重点与难点问题,一直广受关注。而组块分析作为浅层句法分析的重要一环,降低了完全句法分析的任务难度。组块分析系统主要是识别句子中的组块信息并对其分类。组块信息可作为中间产物应用到自然语言处理的诸多领域,比如信息检索、信息提取、文本分类、语音识别等等。随着人工智能地普及,深度学习技术已在诸多领域取得丰硕的成果。当然,自然语言处理也是深度学习的用武之地。基于循环神经网络(RNN)的一系列网络模型能够很好地处理任意长度的序列数据。大量的实践已证明,深度学习算法在处理自然语言处理领域内的诸多任务时,其效果优于基于统计的机器学习算法。本文将深度学习算法运用到组块分析任务中,完成基于深度学习的组块分析系统的设计及实现。本文介绍了组块分析的背景及基础知识,使用到的深度学习算法。结合实际应用,分析业务流程,对系统进行功能需求分析,将系统分为两个子系统:训练模型子系统和组块识别子系统。系统在各子系统中又细分出多个模块以实现不同功能。组块分析系统主要包括数据预处理模块、词向量模块、训练模型模块以及组块识别模块。各模块边界清晰,功能明确。所有模块协同工作,共同组成整个分析系统。本文详细地描述了主要模块及主要功能的实现细节,并根据系统功能需求说明,对各功能进行了功能测试,以保证系统的安全稳定。本文将深度学习模型与传统机器学习模型在处理组块识别任务上进行比较。在相同的训练集和验证集上,最大熵模型与支持向量机模型在不同组块上的准确率、召回率、F1值均达到96%左右。LSTM模型的准确率为97.9%,召回率为97.85%,F1为97.87%。可以看出,基于深度学习的神经网络模型较好地完成了组块分析任务,并且在各个组块的识别效果上具有明显优势。
其他文献
在新时代背景下,社会对人才培养的要求越来越高。学习理解科学史内容是素质教育的重要目标之一。《普通高中生物学课程标准(2017年版)》在实施建议的部分提出要重视科学史与科学本质的学习。并且在最新一轮的生物学教材编制中增加了更大篇幅的科学史内容。由此看来,在课堂教学中引导学生深入挖掘科学史的价值是十分必要的。根据文献研究发现,科学史教学情况是不容乐观的:教师和学生都不愿意花费额外的时间去学习理解科学史
磨削是当下应用最广泛的精加工方法,在镍基合金关键零部件的加工中有着无可代替的作用。为减少磨削时因高温而产生的砂轮磨粒磨损和脱落,以及工件裂纹和烧伤等现象,利用断续磨削与内冷却技术来提高供液效率,采用纳米流体以增强磨削液的换热性能。此外,还设计了磨粒族叶序分布以增强磨削液在磨料区的流动性,从而改善砂轮堵塞现象。本文结合内冷却磨削、断续磨削、叶序分布和纳米流体等技术,采用分子动力学方法分析了复合纳米流
就世界范围而言,不少国家都已经或即将迈入老龄化社会。我国同样如此,随着经济社会的迅猛发展和人口政策的调整,人口老龄化逐渐成为我国一大社会难题。与此同时,随着资本市场改革的不断推进以及利润市场化的调整,商业银行的竞争日益激烈。商业银行若想在动荡、复杂的外部环境中获得竞争优势不得不应对人口老龄化带来的机遇和挑战,调整战略模式,积极开展老年人的营销策略,获得更多的老年人客户群体,为推动自身战略转型获得客
产业园区的盲目建设,导致城市职住不均衡、交通堵塞、地域性特征缺失等现象出现,园区内的企业厂区也呈现出形象不佳、功能不全、环境较差等特点。这些问题制约城市发展、阻碍企业提升、影响职工生活,找出问题原因、寻求解决途径,已迫在眉睫。基于实践项目调查分析发现,企业厂区在项目策划与建筑设计阶段便显露出许多问题。深入分析实践项目,利用归纳法将实践项目中的具体问题进行分类总结,分析建设问题及其产生的原因,并以企
目的:探索和重度慢性阻塞性肺疾病急性加重(acute exacerbation of chronic obstructive pulmonary disease,AECOPD)相关的危险因素并建立预测患者3年和5年发生重度AECOPD风险的列线图。方法:从美国国家心肺血液研究所生物标本和数据信息协调中心申请Subpopulations and Intermediate Outcome Measur
目前我国学者对建筑室内居住环境对人体健康的影响研究逐步增多,但对高校寝室室内环境的研究仍不足。以往的研究主要关注病态建筑综合症,注重居住者所患的疾病诊断研究以及建筑空间类型的研究,却缺乏居住环境与居住者健康这两者的关系机理的探讨。如何运用现场调查的环境质量现象结合量化分析技术,综合评估健康居住环境质量与解析环境缺陷特性,为目前的研究热点。我国绝大多数高校中,寝室单元为单间房,具有居住空间狭小、居住
高压共轨燃油系统是现代化柴油机实现高效燃烧、超低排放的核心系统之一,而共轨喷油器则是高压共轨系统的关键部件,共轨系统设计的成功与否在更大程度上取决于共轨喷油器的设计。目前在采用商业软件进行共轨喷油器理论研究时,通常在电磁阀模型方面采用简化手段进行,如采用电磁力随时间变化的曲线近似模拟电磁阀的工作,或者采用三维电磁软件计算得到电磁力随间隙、驱动电流的变化关系,之后通过把三者关系用map的形式加载到商
研究背景:胶质瘤是颅内最常见的恶性肿瘤,有很高的复发率和致死率,根据世界卫生组织(WHO)肿瘤分级,胶质瘤分为I-IV级,胶质母细胞瘤(GBM,IV级)具有更高的增殖、侵袭和血管形成的能力,中位生存期不超过15个月。随着生物医药的发展,胶质瘤的一些生物标志物和分子分型已经建立,然而,有效且可靠地预示胶质瘤患者预后并指导治疗的生物标志物少之又少。因此,寻找新的更加有效的胶质瘤生物治疗靶点具有重要意义
基于活性位和复合结构对催化剂进行原子级可控的设计和制备是非常重要的。本文致力于通过区域选择性原子层沉积(ALD)方法实现复合催化剂的设计和改性,具体包括:基于晶面选择性与结合能差异,通过调整和优化区域选择性ALD工艺,开发了MnOx/Pd/Al2O3和FeOx/Ni/Al2O3两种不连续包覆的复合催化结构,并分别应用于苯甲醇选择性催化氧化和甲烷干重整反应。通过对两种催化剂的催化性能包括活性、选择性
随着社会生产模式的转变以及科学技术的发展,本质安全、与人共融成为新一代机械臂的发展趋势。本质安全意味着轻型、低速、柔顺的机械臂本体,而基于传统电机、液压的刚性关节驱动器存在功率密度比小、质量大、柔顺性差、安全性低等缺点,基于人工肌肉的柔性关节驱动器具有功率密度比大、质量轻、柔顺性好、安全性高以及高效模拟人体骨骼肌的收缩运动等优点;与人共融意味着机械臂与人处于同一工作空间,在确保人的安全情况下自主完