基于统计规则结合的中文姓名识别

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户:masdfsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文姓名是一个开放集,量大而层出不穷,大多数在词典中没登录,给自然语言处理带来了很大的困扰,该言语描述了基于汉字串频率统计及规则分析的中文姓名识别算法,并给出了实例分析,对自动分词的切分作了有效的调整,其实验结果表明它在机器翻译等领域具有很好的实用价值。
其他文献
该文介绍了对中文校对系统所侦测出来的错误字串提供修改建议的算法。这个算法已应用在IBM中国研究中心研究的中文校对系统CEC中。它首先根据字形、字音、字义或输入编码相近的原则
会议
该文通过对中文文本错误的分析、采用语料库语言学的思想和词语的模糊匹配技术,设计并实现了一个中文计算机辅助校对系统。
随着Internet在中国各地广泛开通,在其上开发便于广大网络用户使用的中文信息交流工具显得十分重要。该文介绍用于此目的的虚拟键盘的设计、运行环境,智能输入系统的设计思想与
真实文本中的未登录词辨识是中文信息处理中的新问题。该文讨论了文本局部统计在汉语未登录词辨识中的应用,探讨了局部缓冲大小和未登录词辨识性能之间的关系,并给出了一种局部
该文尝试了利用基于变换的方法识别中文姓名。设计了5类变换模板,利用基于变换的算法,获取了460条有用的识别姓名规则。他们从新闻和政务信息语料库中,抽取了400个含中文姓名的
8月26日,省政府副省长曹卫星对江苏教育报刊总社所属《江苏教育报》有关工作作出重要批示:在新的发展阶段,做好教育宣传工作,要坚持正确导向,服务基层一线,创新方式方法,努力
期刊