现代汉语句型自动识别的研究

被引量 : 0次 | 上传用户:kingstarKS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每一种语言都有自身的特点,一种语言区别另一种语言,句型上的差异起着重要作用。汉语句型复杂多样,是汉语句法理论中一个重要的研究单位。但是,在中文信息处理中,以句型为目标的研究并不多。本文以汉语句型的自动识别为研究对象,强调结合自然语言处理要求和汉语语法规律,构建统一的句型系统框架,并在该框架下,尝试进行句型分析、研究句型识别策略。在汉语句型的语言理论研究中,本文结合句模理论,提出“阶”的概念,构建了将谓词的句法特性与语义特征结合的谓词知识库,为计算机识别句型提供帮助。在汉语句型识别的策略研究中,本文给出了汉语句型自动识别系统的流程框架。该框架中包含预处理模块和句型识别模块两个部分。预处理模块以去除句子的非句型成分为目的,抽象出句子的句干,填充包括定中结构、状中结构和补中结构的句法关系槽。句型识别模块以判定句干的句型类别为主要目的,并填充包含主谓关系、谓宾关系的句法关系槽。在预处理模块中,本文提出“语片”的概念,将预处理过程分为粘合语片、填充句法关系槽两个流程,并提出基于滑动窗口机制的粘合算法,以及基于上下文无关文法的填充器C-Filler。在句型识别模块中,本文提出了“基于规则匹配”和“基于函数模型”的两种可选策略。“基于规则匹配”的策略中,利用扩充的上下文无关文法,设计了句型识别器Recognizer;“基于函数模型”的策略中,本文首次提出,利用转化函数,将句子转化到坐标空间中,使用函数模型研究句子的句法特征,并通过函数计算获得句子的特征向量用于机器学习,最终利用机器学习得到的决策函数识别句型。“基于函数模型”的策略是一种“引用数学方法研究句子”的新思路。作为策略评估,在句型系统的子集上构建了实验模型,对预处理策略和两种句型识别策略分别进行了评估,实验结果证明了三种策略的可行性。最后,论文从应用角度,在机器翻译、语法错误自动检查、统计汉语句型分布等几个方面,对汉语句型自动识别的应用前景作了简介。
其他文献
目前汽车市场上车型种类繁多,且汽车企业为了适应市场竞争需求不断更新车型,汽车换型时80%以上汽车覆盖件模具也随之更换,所以对大型汽车覆盖件淬硬钢模具高速铣削加工产生了
<正> 轮滑鞋又叫旱冰鞋,说起来也不算是甚么新产品了。只是这些年来随着科学技术的发展,一些新材料新结构的应用,改变了原来鞋体的样式,使之更适于穿用,也更易于玩耍。年纪稍
贵州旅游事业在近三年呈现井喷式的发展,社会对高素质日语旅游人才需求的日益增长,如何在高等院校开展旅游日语方面的教学,培养能够运用日语为来华的日本游客、中日旅游相关
据不完全统计,来本校动物医院就诊的病龟中,有一半以上肠道内有滴虫。国内外关于乌龟滴虫的研究报道不多。目前认为乌龟毛滴虫无致病性,乌龟发病是滴虫与其他病原体共同作用的结
<正>为适应建立社会主义市场经济体制的需要,促进国民经济增长方式从粗放型向集约型的转变,加快我国国有专业银行商业化改革的进程,已经刻不容缓了。专业银行商业化,涉及我国
追溯巴陵戏的历史,它的起源时间是明末清初,在湖南省北部区域兴起并流行起来,是湖南岳阳地区的一大戏剧种类,深受大众的喜爱。作为地方戏,它有着独一无二的语音、声腔及伴奏
随着我国财政预算改革的不断推进与完善,行政事业单位财政预算资金管理面临着新的挑战及机遇。中国经济已进入新常态,今后将转向高质量的经济增长模式。预算收入增速放缓与支
随着研究生招生规模不断扩大,跨专业硕士研究生队伍愈发壮大,其专业适应情况会对他们自身发展、社会发展产生深远影响。本文从跨专业硕士研究生专业适应的现状及造成差异原因
电能替代是用清洁电力替代化石能源的一种终端能源消费方式,船舶岸电技术是实施电能替代的智能电网关键技术之一。文章首先详细介绍了国内外船舶岸电系统技术的应用现状及标
目的评价基层骨科人文关怀对护理质量的影响,总结护理经验。方法对照研究,从2014年223开始筛选患者,截止2015年9月,完成研究122例,采用奇偶数随机数字表达法,奇数60例纳入对照组、