论文部分内容阅读
随着互联网的快速发展,人们对个性化定制产品的青睐度越来越高,个性化字库也随之应运而生,其被广泛用于计算机、报纸、书籍、杂志、教材、文件、包装以及通讯软件,除此之外,个性化字库在教育教学领域也具有其独特的价值,通过设计和创作独具特色的的个性化字体,不仅可以优化教育教学,使教学活动充满趣味性,增强学生的阅读兴趣,而且可以培养学生的创新性和发散性思维,提高动手创作能力;同时个性化字库的生成也可以支持教育应用,对在线社区交互中师生个性的体现具有技术应用价值;其次个性化字库可以打破目前所使用字体“千人一面”的情况,用自己设计的字体来线上交流聊天、发微博、发邮件,“见字如面”、“字如其人”,这无疑是充满个性且富有创意的过程。本文提出的基于汉字笔画与结构信息的个性化字库构造方法及优化,首先书法家在数字录入设备上以正楷书写每个字并辅以一定后期处理的方式,最终生成GB2312字符集的6763字,即字库标准模板。根据标准汉字模板,书写者在触摸屏设备上书写51个字,通过采集其书写的骨架点集计算书写特征,系统记录书写者书写汉字过程中的时序点集信息,包括每个笔画径迹点集中每个点的x、y坐标、书写时间等。使用几何方法计算书写者的书写特征,建立特征字库模板,其中包括部件的特征和整字的特征两个层次,接着根据所获得的书写特征修改标准汉字模板形成书写者的特征模板。后将输入字集的结构分为四类:独体字、包围结构、上下结构、左右结构,在特征模板中将用户输入的手写汉字集按照四类结构进行分类标识,利用机器学习的SVM和KNN分类方法对结构特征数据进行风格分类验证分析,测试结果区分率在80%左右,表明此种结构分类方法可以区分出不同手写汉字所对应的书写者。接着对笔画情境、部件情境进行建立与完善,增加笔画形态的多样性同时让笔形效果更加自然,使得拼合效果更加接近本人的书写风格。最后将书写者的骨架点集与字库特征模板进行映射,生成个性化风格字库。通过后期的主观判断实验分析发现,不论书写者手写原字是美或丑,结构分类优化后生成的字比原始拼合的更加贴近书写者手写风格,同时也更加美观自然,且书写者手写原字较美时其优化拼合效果比手写原字丑的更好;通过图灵实验的测试发现,30位测试者能够正确选择出书写者的手写字有694个,占比为46.27%,即生成字的混淆概率为53.73%,由此说明优化拼合的效果已经达到混淆手写的程度,当然细节方面还可以继续进行优化。