一种混合的中文文本校对方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zyh111111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以模式匹配的方法和3元文法分析的方法为基础,结合语法属性标注和分析的方法,提出了一种混合的中文文本校对方法,其结果优于任何一种方法的单独应用。本文描述了这种方法并将它和其它两种方法进行了分析对比。
其他文献
本文探讨一种新的在科扫描图象中自动识别字符、符号的方法,该研究是基于点相关的神经网络识别技术,这种方法考虑了各处退化的字符样本,训练一个字符时使用一种新的学习规则来自
具有确定词表的词组语音识别是语音识别研究的一个重要方面,应用相当广泛。本文在简单介绍词组语音识别之后给出了一个基于连续语音识别算法和词树约束的汉语词组语音识别方法
目的讨论青年冠心病患者发病的相关问题。方法统计分析法,采用的资料为本院自1997~2005年收治的冠心病患者1892例。结果根据每例患者既往高血压、高脂血症、糖尿病、吸烟及家族
目的应用蛋白质芯片技术筛选单纯性室间隔缺损血清特异标志物。方法采用病例对照设计。用CMIO蛋白质芯片检测56例单纯性室间隔缺损患儿与85例儿科常见痛患儿血清,筛选血清差异
目的探讨铁剂对促红细胞生成素治疗肾性贫血疗效的作用。方法比较慢性肾功能衰竭伴肾性贫血患者在铁剂及促红细胞生成素治疗前后血红蛋白、血清铁蛋白、转铁蛋白饱和度水平的
本文介绍了一种新型点阵汉字压缩技术--“构件嵌套组合”技术的研究,该技术建立在统计学和汉字框架结构的基础上,可实现对汉字高效压缩,能够很好地满足中文移动通讯产品的需要。文
介绍在VB环境下创建多线程应用程序的方法,并给出以VB为开发工具利用API函数创建多线程应用程序示例.
本文提出了一种基于级连分组网的手写数字识别的新方法。这种方法根据将每次分类任务简单化的思想 ,将每个网络的任务简化以提高其辨别能力。整个系统分为两级 ,第一级进行粗分类 ,选取前两个后选字。第二级对两个后选字进行细分类。每个细分类网络完成区分两类特定模式的任务 ,由于每个子网络分类数目的减少导致识别精度的提高。使用我们自己构造的含 1 0万个字符的库进行测试 ,我们的系统达到了在拒识为 5 %以内
<正> 在酱油酿造业中,无论大、中、小型酿造厂现所用菌种大多是沪酿3.042米曲霉,都是以试管斜面培养的菌种作为原菌,三角瓶培养作为一级种子。要求一级种子孢子健壮数量多,纯
目的探讨不同胰岛素应用方案治疗初诊2型糖尿病(T2DM)的疗效。方法50名初诊T2DM患者分为口服降糖药联合诺和灵N治疗(A)组、胰岛素强化治疗(B)组及口服降糖药治疗(C)组,比较其治疗前与