自然语言理解中基于统计与知识相结合的副词歧义处理研究及在机械产品设计中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sansancaicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解是人工智能领域中一个重要的研究方向,而歧义问题是自然语言理解中的一大难题。分词,是中文自然语言理解的前期步骤,分词的准确性直接影响后期自然语言理解各阶段的准确性。  本文的主要研究目标是:单字副词与单字动词通常会组合在一起,形成一个常见词汇,从而在分词过程中产生组合型歧义。针对这个问题,提出一种基于统计与规则相结合的消歧方法,通过建立统计与规则相结合的消歧模型,实现对单字副词组合型歧义问题的有效处理。  单字副词通常会与动词组成固定搭配词,该词在语料中也经常出现,这种现象会导致组合型歧义问题的产生。本文选取若干单字副词,从以下几个方面进行了研究:  首先,对大量歧义现象进行分析,通过对统计模型的分词原理进行研究,发现统计模型处理单字副词组合型歧义问题时,结果是不理想的。因为这种歧义是由副词引起的,并且带有组合型歧义的特性,所以本文以这种思想为原则,通过引入概念从属树和知识表示方法等理论,针对不同的单字副词建立相应的消歧规则,构建消歧规则库。  其次,本文对语料库中所有包含单字副词的搭配词进行统计,构建了一个搭配词典,在使用统计模型分词系统对文本进行初步分词后,根据词典信息对分词结果进行分析,若结果中有歧义字段出现,则对歧义字段进行规则处理。对于没有歧义字段的文本,使用统计模型的分词结果作为输出。将整个消歧流程进行整合,然后从语料库中选取一些句子,使用该消歧模型进行处理,将该消歧模型的处理结果与其他基于统计模型的分词系统的处理结果进行对比,对该模型的性能进行验证,发现其性能明显优于统计模型的分词系统。  最后,将本文构建的消歧模型应用到了智能机械制造系统的自然语言理解模块,辅助机械系统进行需求分析,从而设计出合理的机械加工工艺流程。
其他文献
缠足是我国古代汉民族妇女特有的、后天改变人体、“美化”人体的行为,弓鞋是缠足的物质和精神载体,二者共同构成了我国汉民族的缠足文化。缠足的萌芽与发展历经了一千余年的时
针织结构具有其特殊的结构特点和性能如力学性能和全成型性等,随着各种新型原料和后整理技术的应用,针织结构复合材料在产业用领域得到了广泛的应用与发展,如航天航空、船舶
本文通过对荣华二采区10
期刊
面临着全球化竞争的加剧和经济的快速发展,羊绒制品复杂程度越来越高,更新换代速度越来越快,因此,对产品开发周期和开发成本提出了更高的要求。为了缩短产品开发周期、降低产
随着科技的发展和高度集成化电子元器件的出现,使电子产品维持在正常的工作温度范围内,已逐渐成为当前电子技术发展迫切需要解决的重要问题。由于散热不好导致越来越多的电子元
台风是地球上的空气旋涡,是一种极猛烈的风暴,一个典型的台风直径能达到800 公里甚至1000 公里,中心最大风力可达八至12 级以上。台风通常孕育在赤道附近的热带海面上。至于台风
纳米氧化锌由于其纳米尺寸效应、表面效应以及纳米粒子与基体界面间强的相互作用,具有普通氧化锌无法比拟的特殊性能。但是由于纳米颗粒的表面分子具有极高的表面活性,很容易
以γ-缩水甘油醚氧丙基三甲氧基硅烷(GPTMS)为前驱体、有机醇和水为溶剂制备得到的溶胶,通过轧-烘-焙整理可以赋予羊毛织物良好的防毡缩性能,是一种极具潜力的非氯防毡缩整理方
本文紧密结合医疗机器人的研究需求,以微创手术机器人为研究对象,系统地阐述了一种新型微创外科手术机器人的方案设计、运动学分析、运动学仿真、关键构件强度分析、传动系统设计以及构型设计等方面的内容,所得的研究成果已应用于指导一种新型微创外科手术机器人的样机开发。具体包括如下内容:首先,以微创手术操作的实际需求为基准,在充分研究已经存在的微创手术机器人系统结构优缺点的基础上,阐述了一体式微创手术机器人的概
颜真卿作为唐代的书法大家,不仅将法度森严的楷书推向了极致,同时他的行书上的造诣也颇深,被誉为天下第二行书的《祭侄文稿》是颜真卿行书中的代表作。此稿是为祭奠自己的侄