基于最大熵方法进行动词搭配的自动标注

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:llllljjjjjxxxxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。通过对已标注真实文本的分析,构造了动词搭配对的上下文变量信息特征模板,给出利用最大熵方法抽取动词—动词搭配,对待测的1000句汉语句子应用最大熵方法自动识别出搭配,其中封闭测试抽取正确率为85.6%,召回率达到70.6%。
其他文献
提出了一种频数监督断点的离散化算法。该算法利用所提出的频数监督断点思想产生初始断点,并在此基础上进行断点简约。实验结果表明该算法所产生的断点不仅符合实际数据分布,
为更好地利用相关性描述纹理图像特征,针对目前Contourlet域隐马尔可夫树模型(CHMT)只考虑父结点的一个相邻结点对子结点影响的不足,提出一种加权Contourlet域隐马尔可夫树模型对纹理图像特征提取模型。在分析子结点的状态时,考虑父结点信息的同时利用权重评价父结点兄弟结点对子结点的影响,并通过附加状态转移矩阵体现出来,更加准确地描述了Contourlet系数和HMT的内在联系;运用K-L
<正> 企业报是否具有吸引力,是否能让职工爱不释手,读后是否对读者有所裨益,有很大程度上取决于办报人的宣传艺术。 讲求宣传艺术,提高报纸的可读性,使企业报具有旺盛的生命
<正> “创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。”实验教学在培养创新人才方面,具有理论教学所无法替代的作用,这一教育观念虽然已经在广大教育工作者中取
网络内部链路性能推测对网络操作与评估至关重要,现有估计方法通常针对固定拓扑网络,无法应用于动态路由情形下的未知拓扑网络。提出了一种基于伪似然估计(PLE)和遗传程序设计(GP)
<正> 江泽民同志指出:&#39;思想政治素质是最重要的素质,不断增强学生和群众的爱国主义,社会主义思想是素质教育的灵魂&#39;。推进素质教育就要发挥思想政治课教学主渠道作用
<正> 供水公司搬迁工程(职工食堂、会议室部分)是在1996年元旦初下达的设计任务。工程要求满足360人就餐的食堂和380人开会的会议室;并且还要求三月末进行工程施工。该项工程
用多项式自回归模型对非线性系统中稳定有色噪声建模,利用扩展的迭代重加权最小p范数算法进行模型参数估计。系统研究了分数低阶协方差谱的性质,并对无限方差非高斯多项式自
IP组播至今仍没有在Internet上被广泛应用,其中一个重要原因是组播转发状态的扩展性问题。聚合组播是一种减少组播转发状态的新技术,其主要目标是使网络中能够复合的组播组共用
提出一种基于区域增长的交互三维网格模型分割方法。在区域增长的基础上,首先由用户利用基于勾画的交互方式选定部分顶点作为目标和背景,其余顶点作为未知区域,利用区域增长的方法自动生成目标的边界,从而完成模型的分割。此方法中边界顶点分割结果的好坏直接影响到了最终的分割结果,因此,在利用区域增长方法形成边界时,将既与目标相邻又与背景相邻的顶点标记为特殊点,在其余未知部分分割完成之后,重新对特殊点进行一次区域