汉语基本短语识别的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:leimu438
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文深入研究了汉语基本短语识别和汉语BNP识别技术,取得了以下研究结果:首先探索了汉语基本短语体系的定义,提出的汉语基本短语充分体现了汉语的普遍规律和特点,阐明了它在句法分析中的意义与作用,通过制订汉语BasePhrase标注规范,显示了该定义的可操作性.针对汉语BasePhrase分析,采用了两种策略的概率模型,第一种策略的特点是利用对层次和短语类型编码,直接分析有限层次的短语,其结果既包含了短语类型,又给出了短语的结构划分;第二种策略的特点是分层分析,每一层分别得到最佳的合并状态.同时利用基于转换的错误驱动学习方法对概率模型的标注结果进行校正,转换规则采用了匹配树的存储形式,大大提高了执行效率.实验结果表明,概率模型的优点是为获得标注结果付出的代价小,对符合普遍规律的语言现象分析效果较佳;转换规则较好地处理了语言现象中的复杂或特殊情况,它对提高概率模型的识别结果意义重大.
其他文献
该文以中远程场景运动目标自动监视为研究背景,对智能视频监视系统的各主要环节做了一定的研究探讨,对目前现有的算法进行了总结和改进,在PII级PC机配备少量外围部件情况下,
该课题主要研究对移动节点临时地址和永久地址的绑定.主要过程是:移动节点根据邻居发现算法来检测移动与否,若移动了,就用地址自动配制获取一个转交地址.然后移动节点发送绑
随着因特网络的发展、网络上信息量的增多,智能代理(Intelligent Agent)技术已经逐渐成为计算机研究领域中的一个崭新的课题。本文对因特网上智能搜索Agent作了比较深入的研究,其
本论文研究的课题是研究1751芯片,主要研究1750A系统存储器管理和保护。 作为1750A系统设计的一部分,1751与1750A CPU和1752协同工作,实现嵌入式系统1750A系统的完整功能。为
检测技术的快速发展,出现了许多新的问题有待研究,有很多是传统方法难以解决的问题。由于检测技术在现代社会的重要性,人们在不断探索研究新的检测技术。可拓学是一门新学科,用于
该文从基于构件的软件开发方法的这些特点出发,研究、解决了与这种软件开发方法相适应的软件配置管理技术.该文的工作分为以下几个主要层次:首先,该文提出了基于构件的软件的
该文对Web计算资源发布若干基本问题作了深入研究与探讨,然后讨论了电子商务中的安全和原子等问题并给出解决方案,最后应用Web计算资源发布和电子商务的研究成果,设计了一个
近年来,随着国际互联网的迅猛发展,信息安全、数据保密显得越来越重要,其核心——密码算法的研究也越来越成为一个至关重要的课题。 本文在介绍密码学的两种基本密码算法——
该文首先简单介绍了OIO(Oil in one)软件平台的结构和内容,然后提出了领域框架:勘探开发应用框架需求和开发模式.通过对而向对象技术和组件、框架技术,可视化模型和UML语言的
该文通过对激光束能量场分布和传输特点、光学成像系统原理及光电传感器的工作特点的分析,建立数学模型,提出了三种构造光学系统点扩散函数(PSF)的方法,根据光学系统的卷积模