最大熵方法在英语名词短语识别中的应用研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:lshwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究英语名词短语识别不仅是句法分析的基本问题,而且是进行机器翻译的基础。针对英语名词短语传统识别算法存在速度慢,效率低的难题,为提高识别准确率,提出一种基于最大熵原理的英语基本名词短语识别方法。首先综合考虑英语短语结构特性和上下文的位置来建立特征集模板,采用改进的频次和平均互信息相结合方法提取有效特征,表示为最大熵模型形式,最大熵原理完成最后的识别过程。对Penn Treebank语料库中的英语名词短语进行仿真,证明改进方法对短语识别正确率和召回率均达90%以上,远远高于传统方法的识别率,是一种简单、快速、高效的英语名词短语识别方法。
其他文献
<正>2010年吉尔吉斯斯坦政局持续动荡,吉已经成为中亚地区最不稳定的因素。吉独立近20年,政治、经济转轨的过程始终没有完成。2010年吉尔吉斯斯坦事件是在国际大环境和其国内
针对大型工程建设项目风险评估的实际需求,为对影响进度的风险做好预测,提出一种基于贝叶斯网络的工程项目风险评估模型及推理算法。算法在基于概率传播和更新的贝叶斯网络推
幼儿时期是孩子思维与语言能力迅速发展的阶段,幼儿期口头言语表达能力发展的好坏对幼儿今后的成长、学习和工作都会产生巨大的影响。美术活动是孩子们乐此不疲的活动,活动中
支持向量机的优化算法对准确检索所需信息资料很重要。传统支持向量机参数寻优方法速度慢、运算量大,具有一定的盲目性。针对准确快速检索到所需信息,为提高支持向量机算法的
<正>中性黑BGL(C.I.酸性黑107),既可用于羊毛、蚕丝、锦纶、维纶及其混纺的染色和印花,也可用于皮革制品的着色和染色.该产品的合成一般是以1-氨基-6-硝基-2-萘酚-4-磺酸钠盐
<正>2012年6月8日,中共中央编译局全球治理与发展战略研究中心成立大会暨"全球治理与中国的国际战略"学术研讨会在北京召开。来自中央编译局、中央对外联络部、外交部、中央
《纲要》提出"幼儿园要以游戏为基本活动",要求幼儿老师要把真正的游戏还给孩子,在游戏中促进孩子快乐地成长。为让幼儿在游戏中的学习看得见,以我园百变轮胎游戏为例,谈谈我
脂代谢的任一环节出现异常均可出现脂代谢紊乱,表现为血脂各成分水平的异常改变和组织中脂质的异常沉积。大量流行病学调查显示,脂代谢紊乱与多种严重威胁人类健康的疾病密切
目的:儿童过敏性紫癜(HSP)近年来发病率有上升趋势,影响着患儿的生活质量。其中肾脏损害是最重要而且最严重的并发症,影响其病程和远期预后。早期发现,早期干预治疗,对疾病的
本文是我在上世纪五十年代撰写稿的节要部分.由于某种原因未及完稿即行中辍.原拟今后待继续此项工作旧稿,暂不发表.现碍于主编的热情敦促,只能摘将其中"砭石疗法"部分充数.惟