【摘 要】
:
当前随着互联网时代的技术更迭,数据量呈现爆炸式的增长,每一个用户都是信息的发布者和接受者。因此从海量的数据中抽取出有效的结构化的信息是当下学术界的研究热点之一。实
论文部分内容阅读
当前随着互联网时代的技术更迭,数据量呈现爆炸式的增长,每一个用户都是信息的发布者和接受者。因此从海量的数据中抽取出有效的结构化的信息是当下学术界的研究热点之一。实体抽取(NER)是NLP信息抽取任务中重要的一环。但当前实体抽取的研究多集中在医疗教育,金融等商业价值明显的领域,在信号处理专业领域上的实体抽取目前鲜有人研究。本文将重点研究信号处理领域的实体抽取,并立足该场景的特殊性,搭建信号处理领域的实体抽取模型并提高模型的性能。本文的主要研究内容如下:基于互信息自动抽取信号处理领域术语。术语是专业领域和通识领域的不同之一,专业领域术语多是组合词,为了使得分词时能够将术语正确切分而不破坏组合词的内部结构,一个完备的专业领域术语集是十分重要的。传统的术语自动抽取主要是基于频率和规则的方法,基于频率的方法会出现抽取术语不完整且错误率较高额情况,若是利用规则抽取则会出现规则频繁指定的问题,本文采用基于互信息的方法来抽取信号处理领域的术语,互信息可以表示词语串和词语串之间的结合的紧密度,并且节约了制定规则的时间,提高了总体任务的效率。构建基于依存关系的词向量生成模型。专业领域语料除了在术语上与通识领域等其他领域有不同之外,本文发现专业领域的语句表述方式也与通识领域具有很大的不同。专业领域的句子表述加倍清晰简洁,指代明确。基于这个不同,本文将语料降噪后,提出利用依存关系表征句子在表述上的特点,重构训练语料形式,并用实验证明依存关系特征确实可以提高词向量的语义表示能力,并保存训练结果为下游任务做铺垫。构建基于词向量的信号处理领域的实体抽取优化模型。传统的命名实体抽取模型主要是基于规则的匹配模型,本文则利用基于Bi LSTM+CRF的神经网络模型,将抽取任务用分类任务代替,避免了大量规则的制定,并利用依存词向量以及其他约束特征向量,比如词距,词形等,以此优化抽取的任务性能,最后为模型输出层加上Attention机制增加实体词语抽取的完整性,效果上最终F1均值达到了80.76%。综上所述,本文深入探究信号处理领域的专业特殊性,并以这些特殊性为基础优化命名实体抽取模型,提高抽取任务的性能。
其他文献
当今社会进入大数据时代,发达的科技、高效的信息流通方式,使得社会活动与人们交流变得越来越频繁,产生了大量的数据。如何对这些数据进行挖掘,得到有用的信息,成为当下需要
本文利用Darboux变换研究一个包含四个位势的广义导数非线性Schr(?)dinger方程.首先,我们对此广义四分量导数非线性Schr(?)dinger方程的谱问题进行分析和计算,并构造其关于λ
芯片(integrated circuits,ICs)如今已经应用在人类生活的方方面面。随着万物互联时代的到来,芯片的应用规模将达到新的高度。芯片的安全与我们每个人以及整个国家的安全息息
小农户生产是我国现阶段农业的主要经营形态,在电子商务新经济模式的推动下,小农户农产品的生产目的与流通方式随之转变,商品化水平持续提升,逐渐走向大生产大市场,小农户农
随着移动互联网的发展,人们对基于位置的服务需求日益增长。以GPS为代表的卫星定位系统在室外导航和定位中可以满足绝大多数的需求,但是难以为室内定位服务提供支持。近年来,许多学术机构和组织提出了各种不同原理的定位系统,包括红外线、蓝牙、超声波、UWB、zigbee、WLAN等。其中,由于WLAN无线接入点和搭载WLAN收发芯片的移动设备普及度非常高,基于WLAN开发室内定位系统可以避免增加额外的设备,
党的十九大报告指出“发展社会主义先进文化,不忘本来、吸收外来、面向未来,更好构筑中国精神、中国价值、中国力量,为人民提供精神指引。”可见中国价值的构筑已经成为新时代中国特色社会主义意识形态建设的重要任务之一。习近平总书记指出,“青年兴则国家兴”,青年人选择和确立什么样的世界观、人生观、价值观,直接影响整个国家和社会未来的发展方向,而高校思想政治教育的主要任务恰恰是通过思想政治教育使大学生自觉选择并
本文主要研究了带有饱和控制和随机时滞的离散奇异系统稳定性的问题.首先,这样的一类带有执行器饱和的奇异系统是正则的,因果的和稳定的,时滞以—种随机的方式进入这样—个奇
半导体脉冲激光器在许多领域都有着非常广阔的应用前景,深入研究其物理机制,设计出可产生超短脉冲的半导体激光器,对进一步促进其应用具有重要意义。强泵浦(电或光)的条件有
食品安全状况取决于农产品质量安全水平,农产品质量安全状况取决于农产品产地环境安全水平,农产品产地环境监管法律制度是我国农产品质量安全法律制度的重要组成部分。我国《
本文我们主要研究了一个与三阶矩阵谱问题相联系的四分量非线性Schrdinger型方程的Darboux变换,并构造其精确解.首先,我们以该非线性方程的Lax对为基础,引入了方程的具体表