基于SVM维吾尔文印刷体识别分类器设计

被引量 : 0次 | 上传用户:namedmat123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息化技术的不断发展,新疆各民族人民的工作生活对计算机的应用需求越来越多。许多少数民族传统文献和印刷品,如新闻社、图书馆、古籍文献出版社、档案馆以及一些专业单位所接触到的材料都迫切的需要进行电子化,少数民族文字记录自动输入的需求日益凸显。相较于英文和汉文,我国少数民族文字的字符识别研究并不成熟。维吾尔文是极具代表性的少数民族文字之一,近几年通过对维吾尔文文字识别技术的不断探索和研究,取得了很好的研究成果。本论文通过对维吾尔文字母识别和维吾尔文连体段识别技术特点的总结分析,研究并实验了一种新的结合连体段分布概率的决策树多类SVM分类算法,通过Visual c++实现了以维吾尔文连体段为识别基元的识别分类器系统。主要工作有:1.对维吾尔文连体字母段的分布特点进行统计总结,分析表明连体字母段在使用概率和所含字母个数的统计中有着特别的分布规律,说明了以连体段为识别基元的可行性,为分类器设计做指导准备。2.对支持向量机多类分类算法进行试验分析,比较并选取适用于解决连体字母段大分类问题的多类分类算法。3.在连体段分布规律的启发下,以连体段为识别基元,提出了一种新的决策树支持向量机算法,该算法将最优二叉树构造方法和欧氏距离决策树构造方法相结合,以连体段使用概率值为权值,构造分类决策树。
其他文献
由于中西方民族思维模式和审美习惯不同,企业对外推介英译中存在的问题主要是由于英汉语的两大差异造成的:首先,形合、意合的区别,汉语重形合而英语重意合;其次中英修辞习惯
用1H,1H,2H,2H-(十三氟代辛烷基)三乙氧基硅烷(F8261)对空心微珠(HGM)进行表面改性处理,测定了不同条件下油滴在改性空心微珠(MHGM)表面的接触角及停留时间,考察了改性剂浓度
<正>21世纪进入信息社会,对于信息的指数式增长,我们面临着如何在纷繁复杂的信息中快速、有效地获取自己所需要的信息的问题。随着互联网及通讯技术等信息技术的普及,每天网
孔子一生职业经历复杂,从而继承和发展了丰富的职业伦理文化,尤其是在政治和教育伦理方面。职业有等、因才择业是孔子职业伦理思想的职业伦理观;忠于职守、精钻业务、谦虚谨
采用氯烃溶胀剂、酸酚反应剂、增稠触变剂、表面活性剂、金属缓蚀剂、微晶蜡封闭剂通过合理复配,制备了适合于金属热固性涂层脱除的微晶蜡封闭反应型金属涂层脱漆剂;探讨了微
通过对150例宫颈癌放射治疗后发生6例放射性膀胱炎患者的护理,认为做好心理护理、药物膀胱灌注、指导锻炼膀胱功能、预防感染、加强基础护理等护理措施,是取得良好效果,减轻
新中国成立后,周恩来高度重视海河水利建设,他亲自主持和决策了大型水利工程建设、治理和开发规划的制定与实施以及抗旱打井工作,在治理、开发海河水利的工作中起到了决定性
《理解媒介》是一本部媒介文化研究的经典著作,它以全新的视角来审视媒介与社会的关系,引发人们对媒介本身的关注。本文尝试对麦克卢汉的"媒介即讯息"、"媒介是人体的延伸"等
我们国家在城市生活垃圾处理技术上获得了非常大的发展,但是整体水平还是比较差,一直都是借助于堆放与简单处置的形式给予消化,污染问题较为严峻,城市生活垃圾问题较为显著,