手写数学公式的识别与算法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:zhang11289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,人们能轻易实现信息的远距离交换,极大促进了教育及科研领域的发展。数学公式作为教育及科研领域不可缺少的一份子,其在互联网中的流通尤为重要,特别是老师及科研人员在思考推理过程中写在纸上的公式。因此,如何将这种手写公式转化成便于互联网流通的可编辑形式成为人们关注的话题。离线手写数学公式具有二维结构且书写随意,这给确定符号之间的逻辑关系带来很大困难,故离线数学公式识别具有很大挑战。本文根据其特点,提出一种基于YOLOv5s的公式识别模型,完成的主要工作如下:1.对现有公式识别模型进行分析,本文提出了一种能有效避免错误累计问题的公式识别模型。该模型将公式识别分成两部分,第一部分是用目标检测模型YOLOv5s对公式符号进行识别,第二部分是用符号关系树分析公式结构。2.根据YOLOv5s的数据格式需求,本文制作了一个离线手写数学公式数据集。先从CROHME的官方网站获取在线形式的手写数学公式数据集,该数据是以inkml文件形式存储的;其次用分解、重组和失真的方式对在线数据集进行增强;然后通过Python程序将inkml文件转化成离线图像形式,同时生成本文模型对应的标签;最后,对于公式中书写连笔导致错误的标签,用Labelimg重新标注。3.对公式符号识别部分进行改进。为提高符号识别的识别率,从符号类别角度分析,引入空间注意力机制SAM,利用其中的最大值和平均值池化扩大符号类别的差异特征;从符号自身含义角度分析,引入双向长短期记忆网络Bi LSTM,使符号具有上下文相关联的信息;从Bi LSTM提取或利用上下文相关联信息是否充分的角度分析,改变其层数进行实验,实验证明其层数为3时,信息利用率最大化,最终得到的符号识别模型简记为YOLOv5s_SB3(S表示空间注意力机制,B3表示3层的双向长短期记忆网络),通过与其他符号识别模型进行对比证明了其符号识别的有效性。4.对公式结构分析部分进行改进。将符号识别模型YOLOv5s_SB3与符号关系树结合得到公式识别模型,简记为YOLOv5s_SB3T(T表示符号关系树)。用该模型对公式进行识别,对错误识别的公式进行总结和分析,分数和根号容易出现覆盖范围较小造成结构分析错误。故本文在YOLOv5s_SB3T中引入聚类来减少这类错误,最终得到的公式识别模型简记为YOLO v5s_SB3CT(C表示聚类),通过与其他公式识别模型进行对比证明了其公式识别的有效性。实验结果表明YOLOv5s_SB3CT模型能有效避免传统识别模型中的错误累计问题,识别过程的可见性高于基于神经网络端到端模型。本文提出的符号识别模型YOLOv5s_SB3在CROHME2019 test上的符号识别率为95.67%;公式识别模型YOLOv5s_SB3CT在CROHME2019 test上的表达式识别率为65.47%,本文模型不管是在符号识别还是公式识别领域都取得了较好成果。
其他文献
随着光伏、风电等新能源并网容量的增加,电力系统的潮流调控问题越发突出。相较于统一潮流控制器(Unified Power Flow Controller,UPFC),Sen Transformer(ST)作为一种电磁式潮流控制装置,或为解决潮流调控等问题提供一条经济有效技术路线。在大型电力变压器中,考虑到运输能力、占地面积以及大容量的电力传输,多采用三相五柱式铁芯结构。然而,电力变压器在实际运行的时
学位
有源配电网故障自愈的基本目的是进行故障区段定位、隔离以及非故障区段的供电恢复。传统配电网的网络结构是辐射型、单电源结构,拥有恒定的潮流方向,重合闸、保护配置简易,实现故障自愈较容易。当配电网中接入高渗透率的分布式电源(distributed generator,DG)后,配电网的潮流方向与网络结构都会发生变化,因此影响原有的保护与重合闸功能,从而会导致保护误动、重合闸失败或是拒动。所以含DG的配电
学位
针对能源革命与数字革命相融合为特点的第四次工业革命,国家提出加快推进以信息科技为支撑,推动实现经济社会数字化转型的新型基础设施建设。电力系统建设的新方向是将现代化、信息化、数字化的技术方法与智能电网和互联网相结合,以达到能源与信息的互联互通,使电力服务体系的服务更加优质,运行更加稳定的目的。非侵入式负荷监测(Non-Intrusive Load Monitoring,NILM)作为客户侧泛在电力物
学位
随着“碳中和”、“碳达峰”目标的制定,我国大力推进能源结构调整,积极发展风、光等可再生能源。高渗透率新能源发电出力的波动性和不可控性导致新能源消纳以及调度困难等问题日益凸显。与此同时,可再生能源的大规模并网使得系统调峰问题逐渐显现。在此背景下,本文主要从水光互补发电调度以及深度调峰运行下火电机组调峰主动性两个角度出发,开展了梯级水光互补与火电耦合系统的随机经济调度研究,其主要内容归纳如下:首先,详
学位
由于传统微电网采用公共接入点为机械硬开关的并网方式,无法主动调控功率,从而导致含高比例光伏/风电等间歇式分布式电源的微电网易于出现并网点功率的波动、电能质量低、供需难以平衡等问题。为提高微电网接入的友好性,避免并网运行时产生的不利影响与负作用,本文拟对基于柔性电力电子开关的微电网柔性接入方式展开研究,以确保微电网“友好地”接入配电网,提高含高比例新能源微电网的运行控制水平。首先,建立了基于背靠背柔
学位
为尽快实现“碳达峰、碳中和”的双碳目标,一方面以科学手段加强不同形式能源之间的耦合联系,通过调度能量转化的形式达到其目的;另一方面利用可再生清洁能源代替传统化石能源也是实现双碳目标的重要途径之一。基于此,文中以电力—燃气耦合系统为研究对象,对其优化调度问题展开了深入研究,主要研究内容如下:(1)提出了量子离散差分进化方法,并设计了双层求解方法优化求解含风电电力系统机组组合问题,外层采用量子离散差分
学位
为完成“碳达峰,碳中和”目标任务,我国正在大力推动风电、光伏、小水电等可再生能源大规模、高比例、高质量发展,加快实施可再生能源替代行动,着力提升可再生能源消纳和存储能力,积极构建以可再生能源为主体的新型电力系统。但风电、光伏、小水电等可再生能源具有随机性、波动性及间歇性等特性,大规模接入电网后,会给电力系统安全稳定运行带来诸多不确定因素。因此,为了应对风电、光伏、小水电并网带来的影响,有效充分利用
学位
为了解决电动汽车车载充电机的后级DC-AC变换器输入电流不连续及在不连续处的di/dt较大而导致对电动汽车内部电子系统产生较大电磁干扰及对直流母线电容产生较大的高频冲击的问题。在现有的研究基础上,文中对电动汽车的车载充电机后级DC-AC变换器的拓扑结构及控制策略展开了研究。首先,文中分析了现有输入电流连续的DC-AC变换器的拓扑结构的优缺点,提出一种具有输入、输出电流连续特性的SuperBuck逆
学位
随着社会经济的发展,导致化石能源的过度使用,环境污染日趋严峻,如何调节能源的供应结构成为重要的话题。以风电光伏为代表的清洁能源成为有效的应对途径。区域综合能源系统(Regional Integrated Energy System,RIES)其位于用户侧,可以将多种能源相互耦合在一起,成为一个能源综合利用体,在RIES中能量可以实现在不同子网之间相互流通,很好的利用了不同能源的时间和时空特性,实现
学位
配电网一般采用小电流接地方式,单相接地故障发生后容易导致两相或多相故障,进而造成薄弱环节受损甚至故障范围扩大等不良影响。因此,实现快速、准确的故障线路判断和故障定位十分重要。而选线测距目前存在暂态特征不易提取、单一特征选线精度很低以及传统行波测距方法不适用于混联线路等问题。针对暂态信号特征辨识度低、特征不易提取等问题,文中提出一种改进补充集合经验模态分解(CEEMD)的零序电流特征提取方法。改进算
学位