基于语义的汉语句法分析研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:ljmworkshop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,自然语言处理技术得到了快速的发展。句法分析作为自然语言处理中的关键技术之一,从一开始就受到了研究者们的极大关注。句法分析性能的提高对信息检索、信息抽取以及机器翻译等应用都会产生重要的推动作用,但由于资源和技术的不足,它在很多具体应用中尚未发挥效用。   通常,获取句子的句法结构并不是最终的目的,但它却是探寻句子深层语义信息的必经之途。句法和语义之间相互作用、相互影响的关系,说明语义知识对于句法分析是有重要的作用。本文研究的目的是探索语义是如何对名词短语识别和依存句法分析产生影响的,研究的内容包括以下四个方面:   (1)自然语言处理的模型中,通常选取词形、词类以及语义来作为特征,本文根据模型参数训练的结果,分析了词汇语义、词形和词类三者在名词短语识别中的稀疏度和贡献度等信息,并用数据分析的结果显示出词汇语义属于中等类度的特征。   (2)为了比较加入语义先后对名词短语识别的影响,本文构建了选取不同特征的名词短语识别模型,通过实验结果的分析,发现词汇语义信息对名词短语的识别是有一定的作用的,但结果会受到语义粒度的影响。   (3)为了解决词汇语义歧义的问题,本文将语义标注过程和名词短语识别过程统一到一个模型中进行处理,使得模型能够处理未标注词汇语义的句子。实验结果显示,词汇语义歧义对识别结果的影响小于特征数量的影响。   (4)依存句法分析的一个重要问题是数据稀疏,本文在原有的依存分析模型中加入了从同义词词林中提取的词汇语义信息,提高了分析的正确率。
其他文献
命名实体识别作为序列标注任务之一,与分词、词性标注等都是中文自然语言处理的基本任务。多个自然语言处理的应用,如信息抽取、信息检索、机器翻译和问答系统等都依赖命名实体
现代石油产业中,石油储量的预测是制定能源规划的重要组成部分。通过石油储量预测,可以制定最优的石油战略、安排石油建设以及优化配置等等。预测结果的合理性主要取决于预测方
随着计算机软硬件技术的发展使得计算机的应用领域越来越广泛,许多公司都建立了自己的内部网络用来提高办公效率,降低运营成本,这就使得通过网络传输的数据不断增加,网络在为企业
负选择算法是人工免疫的分支,对自我和非我细胞区分过程进行计算模拟,主要是模拟胸腺中T细胞的成熟过程。由于计算机安全领域的核心问题是识别异常状态,这与生物免疫系统所遇
随着分布式计算环境中,网络上的节点向着智能化和服务性方向发展,主体(Agent)和多主体系统(Multi-AgentSystem,MAS)成为支持开放的、可重构和可伸缩的新型分布式协同计算的重要
在感知真实世界时,人眼通过在视野内场景的各个区域问跳转以移动注意焦点、获取图像中的信息。视觉搜索是人最常发生的视觉行为之一,相较于一般的自由观看任务,视觉搜索中的眼动
针对现行石油勘探开发关系数据模型的缺点,深入研究了国际标准POSC数据模型。分析了Epicentre V3.0的高层模型、特点,并总结出Epicentre对中国油田信息标准化的指导意义。在厘
在油田勘探中,声波测井数据常用于计算储层孔隙度、地层压力、油藏储量等工作。井眼的极端扩径情况对声波测井数据会造成影响,消除这种影响对于油田勘探至关重要。传统的基于模
地震反演技术是伴随着地震技术在油田勘探与开发中的不断深入应用而发展起来的,是目前储层预测与描述的最有效工具,但由于其固有存在的多解性,不深入分析进行盲目应用具有一定的
练习是教材编著的重要组成要素之一。练习的重要地位可以从两方面阐述:其一,从心理学角度看,练习是把短时记忆转化为长时记忆的手段;其二,从语言学习理论的角度看,练习是把掌