基于最大熵模型和规则的中文姓名识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jhxuxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文姓名识别是中文信息处理的一项重要技术,识别的召回率对其它需要以姓名识别为基础的中文信息处理技术有至关重要的影响。提出了一种统计模型和处理规则相结合的中文姓名识别方法:首先以最大熵模型识别潜在姓氏,而后再通过判定规则作进一步处理。真实语料的开放测试表明,该方法在召回率方面有明显的优势,可以达到94%以上的召回率,同时能保证较高的准确率。
其他文献
<正>长江流域和长江三角洲是中华文明的发源地,也是中国现代经济和人类活动最发达的地区。通过对长江三角洲沉积演化的研究来认识长江流域的气候、环境以及人类活动具有十分
会议
舆论在思想政治教育中具有举足轻重的作用。舆论可以使我们掌握人们的思想动向。通过舆论,可以促使人们的思想向我们提倡与褒扬的方向发展。在思想政治教育中,要把舆论作为一
汉语自动分词是中文信息处理的基础工程,中文姓名的自动识别则是汉语自动分词的难点之一,已经成为制约自动分词系统准确率的一大瓶颈。本文突破传统的规则与统计相结合的识别
文章以主题法为基础,论述了概念组配的基本原理,分析了影响医学检索质量的原因并提出了解决问题的相应措施。
挤压法漂白化机浆(Bleached Extruder Chemi-Mechanical Pulping,简称BECMP)是一种新型高得率制浆方法,具有高得率、高品质、低能耗、低污染、短流程、国产化的特点。本论文
本文通过对西沙海槽HX132PC站位岩心沉积物稀土元素组成的系统研究,结合该柱状样浮游有孔虫的氧同位素地层研究,对比分析了南海北部陆坡西沙海槽区晚第四纪以来的沉积物物源
伊斯顿于20世纪50年代末发起"芝加哥研究",倡导政治社会化的政治理论;认为儿童政治社会化的基本内容是政治倾向,通过对政治系统的依附及其扩散性支持得以完成;确信政治社会化
运用文献资料调研、调查研究和数理统计等方法 ,对北京市商业体育俱乐部的经营问题从微观经济学的角度出发 ,从经营者和消费者两个层面进行了系统分析。结果表明 :北京市商业
中药提取是中药生产线上最关键的和排在最前一道工序,是决定中药生产中收得率和水电气能耗的关键,提取设备的自动化是中药生产现代化的关键环节。当前工厂使用的中药提取设备
我国的行政审批制度脱胎于计划经济体制,与以管制为本质特征的全能统治型行政模式具有紧密的内生联系,行政审批在一定阶段内对资源配置、社会风险控制起了重要作用。随着改革