结合依存关系与语义贡献量化的词表示优化研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:A359714977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词表示是自然语言处理领域的基本问题,对自然语言认知、神经网络语言模型等领域的研究和应用具有重要的意义。分布式表示将词汇映射为低维稠密的实值向量,能有效捕捉词汇间的语义关联,是当前词表示的重要研究方向。分布式表示模型通常利用目标词与上下文的共现特征进行迭代学习,因此词表示的准确性与上下文息息相关。但现有词表示模型在上下文的构造和表示上仍存在着如下不足:(1)词表示学习中上下文的范围选择不科学。现有词表示模型在构造上下文时往往采用固有的上下文窗口或随机性策略,忽略词之间的句法关联,导致上下文与目标词的语义关联不充分。(2)词表示学习中上下文词对目标词的贡献量化问题。大多数词表示模型将上下文词同等对待,忽略各词对目标词的语义贡献存在着差异性,导致上下文表示不准确。针对现有词表示模型中上下文所存在的不足,本文结合依存关系与一种语义贡献量化方法对词表示模型中上下文的构造与表示进行优化。研究内容如下:(1)基于依存关系与语义贡献量化的词表示上下文优化策略。针对词表示模型中上下文的范围选择问题,提出一种基于依存关系的上下文构造优化方法。该策略将依存关系融入到上下文构造中,并对依存句法的差异进行衡量,以提高上下文与目标词的语义关联性;针对词表示模型中上下文词对目标词的贡献量化问题,提出一种基于词序与词性的语义贡献度计算方法。首先根据词性设计一种权重矩阵,然后利用该权重矩阵与词序加权函数对上下文词的语义贡献进行定量表示。在此基础上,提出一种基于依存关系与语义贡献量化的词表示模型EDW。(2)基于多阶依存关系的词表示上下文再优化。为了进一步优化词表示模型中上下文的构造与表示,在(1)的基础上提出一种多阶依存关系表示方法。将多阶依存关系集成到词表示模型的目标函数中,利用神经网络提高模型对依存关系中语义成分捕捉的准确性,使词表示模型能获得更具稳定并附有语义特征的上下文,进而提出一种基于多阶依存关系与语义贡献量化的词表示模型EMDW。本文通过词相似性、词类比和文本分类任务对EDW和EMDW模型进行了评测,验证了本文提出的上下文优化策略能够有效地提高词表示的准确性。最后,基于以上研究成果设计并实现了科技资源语义搜索引擎,并将其应用于佐创智推精准匹配平台,以便用户更精准、全面地对科技资源进行检索。
其他文献
锌电极具有成本低,来源广,无环境污染,平衡电位低,比能量高等优点,在碱性电池中被广泛应用。但锌基二次电池在充放电循环中容易出现锌枝晶成长,锌钝化和自放电严重等问题,会严重影响电池性能和循环寿命。目前一般通过改变负极基材和使用电解液添加剂的方法来解决上述问题,研究方法主要以实验为主,但实验过程中可能会受到环境、技术、实验条件等因素的限制,也无法从微观角度解释负极基材材料的差异性。本课题采用第一性原理
乡村旅游是以开发和利用各类特色化的乡村旅游资源为根本目的的一类文化活动。现阶段,随着乡村旅游业的快速崛起,农村经济又重新迸发出新的活力。与此同时,还进一步的提升了农民的收入水平,并为农业的又好又快发展而注入了更多的动力。针对国内乡村旅游业的发展状况,笔者有针对性的提出了几点意见和想法,主要目前,关于乡村旅游业的发展,国内学术界多是概述一些先行示范区的实践经验和所取得的成果,而很少有学者选择将乡村旅
他克莫司作为一种新型高效免疫抑制剂已得到广泛应用,本文通过改造重要初级与次级代谢途径靶基因与添加外源物质提高他克莫司产量。基于实验室先前的代谢组学分析可知,莽草酸途径是生产他克莫司的一个重要初级代谢途径,组合过表达莽草酸激酶与脱氢奎宁酸合成酶基因使他克莫司产量相对于出发菌株提高了33.1%。为了进一步探索次级代谢途径中能够有效提高他克莫司产量的靶基因,通过基因组尺度代谢网络模型进行预测分析是一种有
论文对高科技电子消费品感性工程(Kansei Engineering)中的关键感性意象词汇进行了系统研究,首先对通过高科技产品造型形象的感性意象分析与测定设计调查、语意量表法以及数
随着我国金融经济的不断发展,股市形势也变得更加复杂,以往传统的投资方式已经不能满足人们日渐增长的投资需求。量化投资是近年来股票投资研究的流行趋势之一,即对海量历史数据进行分析得到一种可以获取稳定超额收益的投资策略。本文以股票技术指标为研究对象,应用改进的灰色关联度分析法对大量历史数据进行实证分析,提出了一个新的量化投资策略。首先,为了研究股票技术指标间的关联度,将相关分析与聚类分析融入到传统的灰色
1978年,党中央十一届三中全会作出了实行改革开放的重大决策。到现在,改革开放已经发展到第四十个年头,中国经济保持持续快速发展,经济建设取得了很大成就。伴随中国经济的腾
学位
菊三七Gynura japonica(Thunb.)Juel.是我国民间常用中草药,又名土三七,具止血、活血化瘀等功效.又因其根茎与五加科三七属植物三七Panax notoginseng(Burk.)F.H.Chen极为相似,因此常被误服或误用。特别是近年来,因误服菊三七导致肝窦阻塞综合征(Hepatic sinusoidal obstruction syndrome,HSOS)的事件频发,引起了
固氮反应是自然界仅次于光合作用第二大重要反应,保证了在氮循环过程中游离态氮气向可吸收的化合态氮的有序转化。目前,哈伯固氮法是主要固氮方法但因其苛刻的反应条件带来巨大的能耗及海量碳排放。与其相比,光催化技术可利用太阳能在温和的反应条件下,实现绿色、低能耗的固氮。石墨相氮化碳(g-C3N4)为非金属光催化剂,因其物理化学性质稳定、廉价易得等优点被广泛应用于催化固氮领域。然而,传统g-C3N4的光生空穴
形变和热处理是镁合金中常见的强化手段,通过形变强化和析出强化可以提高镁合金的综合性能,充分发挥其轻质的特点,推进在工业中的应用。本文选取Mg-8Gd-3Y-0.4Zr(GW83K)合金