基于变换的中文姓名识别技术探讨

来源 :1998中文信息处理国际会议 | 被引量 : 0次 | 上传用户：murrayxu

【摘要】

：

该文尝试了利用基于变换的方法识别中文姓名。设计了5类变换模板，利用基于变换的算法，获取了460条有用的识别姓名规则。他们从新闻和政务信息语料库中，抽取了400个含中文姓名的

【作者】

：

郑家恒谭红叶

【机构】

：

大学计算机科学系(太原)

【出处】

：

1998中文信息处理国际会议

【发表日期】

：

1998年11期

【关键词】

：

中文姓名识别基于变换的学习算法汉语自动切词

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文尝试了利用基于变换的方法识别中文姓名。设计了5类变换模板，利用基于变换的算法，获取了460条有用的识别姓名规则。他们从新闻和政务信息语料库中，抽取了400个含中文姓名的句子作为训练集。封闭测试结果，召回率达87℅，准确率达96℅。

其他文献

“中文信息处理平台（ＣＩＰＰ）”工程

会议

中文信息处理平台

支撑与匹配——知识经济环境中的IRM

目前在世界许多发达国家和地区,作为知识经济基础的信息资源产业IRI(INFORMATION RESOURCE INDUSTRY)对经济增长的贡献率已达到或超过50%,总产值超过一万亿美元。这使许多国

期刊

知识经济环境IRM经济增长信息资源排它性空间科学技术机会成本资源约束生产要素边际收益

中文校对软件标准评测系统的构造

该文介绍了一种针对中文校对软件的标准评测系统的构造方法，其中包括评测指标的确定及标准评测集的建造。该评测系统是由ＩＢＭ中国研究中心在开发中文校对系统ＣＥＣ时建立起来的，并贯穿应

会议

中文校对系统软件标准评测系统研制开发研究中心校对软件评测指标评测结果构造方法全过程中国应用建造

2015中国数据新闻发展报告

本文通过对中国18家数据新闻团队的半结构化深度访谈和对6个代表性数据新闻专栏的内容分析,研究中国数据新闻的发展现状、问题与趋势。研究发现,截至2015年12月底,数据新闻生

期刊

数据咨询团队建设百度指数广告模式可视化方法新华网日常化腾讯名第广告价值

中文校对系统中的修改建议提供算法

该文介绍了对中文校对系统所侦测出来的错误字串提供修改建议的算法。这个算法已应用在ＩＢＭ中国研究中心研究的中文校对系统ＣＥＣ中。它首先根据字形、字音、字义或输入编码相近的原则

会议

中文校对系统修改建议算法字处理软件Ｌｏｔｕｓ侦测研究中心统计模型输入编码二元语法字音字义字形中国整理应用评价集成词典

我国中文信息处理技术的发展与展望

会议

中文

一个计算机辅助中文校对系统

该文通过对中文文本错误的分析、采用语料库语言学的思想和词语的模糊匹配技术，设计并实现了一个中文计算机辅助校对系统。

会议

中文校对系统语料库词语模糊匹配

Internet网上的虚拟汉字键盘及其智能输入系统

随着Internet在中国各地广泛开通，在其上开发便于广大网络用户使用的中文信息交流工具显得十分重要。该文介绍用于此目的的虚拟键盘的设计、运行环境，智能输入系统的设计思想与

会议

虚拟键盘汉字键盘智能中文信息运行环境网络用户输入系统设计思想交流工具方法及中国开发

中文信息处理与国家信息化建设

会议

中文信息处理国家

局部统计在汉语未登录词辨识中应用和实现方法

真实文本中的未登录词辨识是中文信息处理中的新问题。该文讨论了文本局部统计在汉语未登录词辨识中的应用，探讨了局部缓冲大小和未登录词辨识性能之间的关系，并给出了一种局部

会议

局部统计汉语未登录词辨识应用真实文本子系统中文信息处理实现方法清华大学词性标注新华社性能通讯实验切分精度分词

基于变换的中文姓名识别技术探讨

与本文相关的学术论文