基于认知机理的汉字智能造字之汉字基元研究

被引量 : 0次 | 上传用户:etzhenghao2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的中文信息处理系统都采用字库,基于字库的中文处理平台虽然为我国的中文信息化做出了不可磨灭的贡献,但由于其不是造字而是选字的特点而带有许多不足:不能建立长期稳定的信息化标准、不能很好地传承汉字文化、不符合汉字认知机理、与汉字教育脱节、信息熵高等。本文在对汉字的认知机理进行分析研究的基础上,将汉字文化和认知科学的成果相结合,对汉字智能造字的基础——汉字基元进行了深入的研究和探讨。主要研究内容和研究结果如下:(1)在对汉字字库相关中文信息处理流程进行深入分析和述评的基础上,在认知心理学原型理论的指导下,深入研究了人对汉字的认知机理,并将这种认知机理应用于计算机,在计算机进行汉字智能造字的实现原理方面进行了理论分析和实验研究。(2)本文着重研究作为造字基石的汉字基元。深入分析了与汉字基元相关的研究,得出汉字部首和汉字部件可作为汉字基元的主要来源但不能直接采用的结论。在此基础上,兼顾传承文化、方便使用和方便计算机处理的原则,提出了汉字基元的提取流程。(3)依据上述流程开展大量的实验研究,探索了以工程实验方法研究文化问题的途径。本文选取GB18030收录的27484个汉字作为实验样本集,以独体字和《辞海》的250个部首作为初始基元进行大量的实验研究,通过实验和分析,提取获得了877个汉字基元。(4)利用计算机技术设计开发了汉字基元计算机研究平台。研究平台对相关信息进行查询以便研究分析;对汉字基元进行字频统计,表明提取得到的汉字基元集符合汉字的认知规律且能够完全覆盖27484个汉字;对汉字基元字形信息的分类统计可为汉字基元映射知识提供前期研究的实验数据;对汉字编码的识别解析为智能造字的输入提供了可能的解决途径。
其他文献
为了考查突发公共卫生事件后公众的出游意愿,在MGB模型的基础上,构建影响出游意愿各自因素之间关系的概念模型.提出了10个假设,揭示突发公共卫生事件后各因素对出游意愿影响
<正>2014年,伴随着阿里巴巴在美国的成功上市,跨境电子商务开始为越来越多的人们所熟知,它是近年来对外贸易发展变化的新业态,也是国家大力扶持的新型产业。支持跨境电子商务
目的探讨三腔喂养管应用于重度烧伤合并应激性溃疡出血患者的临床效果。方法将我院烧伤科2012年2月~2014年2月收治的42例重度烧伤合并应激性溃疡出血的患者,随机分为实验组(n
<正>央视春节联欢晚会(以下简称春晚)自1983年首次成功举办以来已经走过了二十多年。在这些年里,春晚在给人们带来无限欢乐的同时,也在不断地走向困境,受到人们的非议。究其
针对手工编制集装箱装车配载方案费时、配载不合理等问题,基于集装箱和铁路车辆的参数,推导集装箱装车后铁路车辆的转向架承重、左右两转向架承重差和合重心横向偏离量的计算
广义有限元方法是常规有限元方法在思想上的延伸,它基于单位分解方法,通过在结点处引入广义自由度,对结点自由度进行再次插值,从而提高有限元方法的逼近精度,或满足对特定问
<正>近年来,媒介环境发生着深刻变化,移动互联网始终呈现持续爆发的态势,市场规模不断扩大,用户不断增加。同时,人们的注意力和阅读习惯发生深刻变化,读者花费在移动客户端上
简述了江南古桥如杭州拱震桥、玉带桥、中东河桥等的文化背景,并就景区规划中,景观桥的造型艺术作了评述。
马克思与凯恩斯的经济周期理论在对经济危机产生根源的认识上存在重大差别。马克思认为,经济危机根源于资本主义制度决定的资本主义基本矛盾,而自由放任的市场和资本主义制度
分析全球金融危机的特点和根源,必然联系到虚拟资本。马克思曾从多个层次科学而系统地考察了虚拟资本。虚拟资本是与现实资本相对立的范畴,是资本主义经济关系的外在表现,是