基于统计规则结合的中文姓名识别

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户：masdfsd

【摘要】

：

中文姓名是一个开放集，量大而层出不穷，大多数在词典中没登录，给自然语言处理带来了很大的困扰，该言语描述了基于汉字串频率统计及规则分析的中文姓名识别算法，并给出了实例分析，对

【作者】

：

王省黄德根杨元生

【机构】

：

理工大学计算机技术研究所

【出处】

：

全国第五届计算机语言联合学术会议

【发表日期】

：

1999年期

【关键词】

：

统计规则中文姓名自然语言处理实例分析识别算法频率统计机器翻译规则分析词的切分实验描述困扰价值汉字词典

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文姓名是一个开放集，量大而层出不穷，大多数在词典中没登录，给自然语言处理带来了很大的困扰，该言语描述了基于汉字串频率统计及规则分析的中文姓名识别算法，并给出了实例分析，对自动分词的切分作了有效的调整，其实验结果表明它在机器翻译等领域具有很好的实用价值。

其他文献

中文校对系统中的修改建议提供算法

该文介绍了对中文校对系统所侦测出来的错误字串提供修改建议的算法。这个算法已应用在ＩＢＭ中国研究中心研究的中文校对系统ＣＥＣ中。它首先根据字形、字音、字义或输入编码相近的原则

会议

中文校对系统修改建议算法字处理软件Ｌｏｔｕｓ侦测研究中心统计模型输入编码二元语法字音字义字形中国整理应用评价集成词典

我国中文信息处理技术的发展与展望

会议

中文

一个计算机辅助中文校对系统

该文通过对中文文本错误的分析、采用语料库语言学的思想和词语的模糊匹配技术，设计并实现了一个中文计算机辅助校对系统。

会议

中文校对系统语料库词语模糊匹配

Internet网上的虚拟汉字键盘及其智能输入系统

随着Internet在中国各地广泛开通，在其上开发便于广大网络用户使用的中文信息交流工具显得十分重要。该文介绍用于此目的的虚拟键盘的设计、运行环境，智能输入系统的设计思想与

会议

虚拟键盘汉字键盘智能中文信息运行环境网络用户输入系统设计思想交流工具方法及中国开发

中文信息处理与国家信息化建设

会议

中文信息处理国家

局部统计在汉语未登录词辨识中应用和实现方法

真实文本中的未登录词辨识是中文信息处理中的新问题。该文讨论了文本局部统计在汉语未登录词辨识中的应用，探讨了局部缓冲大小和未登录词辨识性能之间的关系，并给出了一种局部

会议

局部统计汉语未登录词辨识应用真实文本子系统中文信息处理实现方法清华大学词性标注新华社性能通讯实验切分精度分词

基于变换的中文姓名识别技术探讨

该文尝试了利用基于变换的方法识别中文姓名。设计了5类变换模板，利用基于变换的算法，获取了460条有用的识别姓名规则。他们从新闻和政务信息语料库中，抽取了400个含中文姓名的

会议

中文姓名识别基于变换的学习算法汉语自动切词

加快中西部地区经济发展的战略对策

会议

中西部地区经济发展战略对策

曹卫星副省长对《江苏教育报》作出重要批示努力做教育改革发展的引导者、促进者和参谋者

8月26日,省政府副省长曹卫星对江苏教育报刊总社所属《江苏教育报》有关工作作出重要批示:在新的发展阶段,做好教育宣传工作,要坚持正确导向,服务基层一线,创新方式方法,努力

期刊

江苏教育曹卫星教育改革专家视点教育热点专业类发展内涵教育工作教育动态发展阶段

WTO大事记

期刊

基于统计规则结合的中文姓名识别

与本文相关的学术论文