基于汉字笔画和结构信息的个性化字库构造与优化

来源 :南京师范大学 | 被引量 : 3次 | 上传用户:zxpmine01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,人们对个性化定制产品的青睐度越来越高,个性化字库也随之应运而生,其被广泛用于计算机、报纸、书籍、杂志、教材、文件、包装以及通讯软件,除此之外,个性化字库在教育教学领域也具有其独特的价值,通过设计和创作独具特色的的个性化字体,不仅可以优化教育教学,使教学活动充满趣味性,增强学生的阅读兴趣,而且可以培养学生的创新性和发散性思维,提高动手创作能力;同时个性化字库的生成也可以支持教育应用,对在线社区交互中师生个性的体现具有技术应用价值;其次个性化字库可以打破目前所使用字体“千人一面”的情况,用自己设计的字体来线上交流聊天、发微博、发邮件,“见字如面”、“字如其人”,这无疑是充满个性且富有创意的过程。本文提出的基于汉字笔画与结构信息的个性化字库构造方法及优化,首先书法家在数字录入设备上以正楷书写每个字并辅以一定后期处理的方式,最终生成GB2312字符集的6763字,即字库标准模板。根据标准汉字模板,书写者在触摸屏设备上书写51个字,通过采集其书写的骨架点集计算书写特征,系统记录书写者书写汉字过程中的时序点集信息,包括每个笔画径迹点集中每个点的x、y坐标、书写时间等。使用几何方法计算书写者的书写特征,建立特征字库模板,其中包括部件的特征和整字的特征两个层次,接着根据所获得的书写特征修改标准汉字模板形成书写者的特征模板。后将输入字集的结构分为四类:独体字、包围结构、上下结构、左右结构,在特征模板中将用户输入的手写汉字集按照四类结构进行分类标识,利用机器学习的SVM和KNN分类方法对结构特征数据进行风格分类验证分析,测试结果区分率在80%左右,表明此种结构分类方法可以区分出不同手写汉字所对应的书写者。接着对笔画情境、部件情境进行建立与完善,增加笔画形态的多样性同时让笔形效果更加自然,使得拼合效果更加接近本人的书写风格。最后将书写者的骨架点集与字库特征模板进行映射,生成个性化风格字库。通过后期的主观判断实验分析发现,不论书写者手写原字是美或丑,结构分类优化后生成的字比原始拼合的更加贴近书写者手写风格,同时也更加美观自然,且书写者手写原字较美时其优化拼合效果比手写原字丑的更好;通过图灵实验的测试发现,30位测试者能够正确选择出书写者的手写字有694个,占比为46.27%,即生成字的混淆概率为53.73%,由此说明优化拼合的效果已经达到混淆手写的程度,当然细节方面还可以继续进行优化。
其他文献
【摘 要】 随着新课改和高考改革不断深入,语文学科的重要性越来越突出,语文课堂教学效率的高低直接决定语文教学质量的高低,如何提高高中语文课堂教学效率成为语文教师探究的课题。作者就此尝试提出一些粗浅的看法和建议,以求和同仁们进一步交流探讨,共求进步。  【关键词】 高中语文;高效课堂;营造策略  【中图分类号】G632.20 【文献标识码】A 【文章编号】2095-3089(2015)25-0-01
随着航天事业的发展,航天卫星要完成许多复杂而艰巨的太空任务,太阳能电池阵作为卫星上重要的装置,可为卫星在轨工作提供所需的电能。太阳能电池阵由数块太阳能帆板和若干展开机构组成,展开机构驱动太阳能帆板展开成太阳能电池阵。目前的展开机构大都只具有展开功能,并且结构复杂,还需要另设锁定机构实现太阳能帆板的锁定到位,所以研制轻质量、小体积、高刚度、多功能的展开机构成为一项重要的研究工作。带簧作为一种弹性薄壳
再制造品是采用特殊工艺对回收产品进行再加工,生产的一种等同于新品的产品。作为一种特殊产品,由于再制造品存在着回收、生产环节信息的不对称现象,导致消费者无法了解该产品。模糊厌恶理论表明,当某事物让人感觉模糊不清时,人们的厌恶和回避心理就更加强烈;另外已有研究也表明,消费者模糊态度会影响再制造品偏好。那么,考虑到模糊态度对再制造品偏好的影响折扣系数呈现怎样的分布?折扣系数作为需求函数的重要参数,对新品