【摘 要】
:
面向数学检索对含有数学内容的科技文献资料收集与整理的特殊需求,针对中文印刷文献图像中数学公式定位的方法展开研究。首先,通过定义能够反映连通区域游程变化的EEN(Edge t
论文部分内容阅读
面向数学检索对含有数学内容的科技文献资料收集与整理的特殊需求,针对中文印刷文献图像中数学公式定位的方法展开研究。首先,通过定义能够反映连通区域游程变化的EEN(Edge to Edge Notation)特征函数来提取文档中连通区域在水平和垂直方向上坐标的分布情况;其次,基于该特征函数对文献进行预处理,包括噪声去除和倾斜校正等;然后,利用该特征函数能够直观、充分反应水平和垂直方向图像成分分布特征的特点,实现符号层次的版面分析及文本行底层信息提取;最后,结合数学公式的布局特征和内容特征设计适合中文文档特点的孤立数学公式和内嵌数学公式的定位算法,并设计相应的算法对公式区域进行合并。实验结果表明,利用该方法能够较好地对文献版面成分进行辨析,实现对版面中孤立数学公式和内嵌数学公式的定位。
其他文献
在无线传感器网络中,节点是电池供电,能量有限,而且当能量耗尽时没有外界补充。因此,能量对节点来说是最宝贵的资源,若不合理利用则会影响整个网络的生命周期。路由协议作为无线传
全球导航卫星系统(Global Navigation Satellite System,GNSS)不仅为用户提供了导航、定位和精确授时信息,还提供了高稳定的电磁辐射信号。基于GNSS的微波遥感(GNSS-Reflections或
在这互联网技术高速发展的21世纪,网络中产生的流量明显剧增,随着用户交互信息越来越多、共享文件越来越大,P2P这种参与节点既是服务器又是客户端的应用模式因其快捷可靠的网络
随着传感、通信、计算等相关技术的迅速发展,现代遥感技术能够准确、动态地提供多种对地观测数据,可获取的遥感影像呈现指数级增长。丰富的遥感影像数据为规划利用、环境监测、
车间作业调度(Job-Shop Scheduling Problem)是一个具有代表性的NP-hard问题,可是到目前来看,还没有一种最准确的方法能够表示出来。车间作业调度的NP-hard问题是生产中的核心
随着数字图像处理与计算机视觉的发展,数字图像处理技术已被广泛应用到各个领域。其中,数字图像处理与医学的结合已越来越受到重视。斜视检测技术是一种通过处理和分析用户眼球
随着Android手机的普及,人们对Android手机游戏的需求量越来越大。由于玩家对手机游戏品质的要求越来越高,游戏画质的精美程度已经不再是判断一款游戏好坏的唯一标准,游戏中的人
数学表达式中包含数字、运算符、字母等多种符号,加之结构复杂多样,为实现其索引与检索带来传统全文检索技术所不曾有过的困难。本文通过对数学表达式中符号间相互关系的分析
在科学计算与工程领域中,将计算问题离散之后,往往会得到大型稀疏线性方程组。线性方程组的求解占用了整个问题计算的很大部分时间,在油藏模拟中这一比例高达80%。因此快速高效地
车牌的定位与字符分割算法研究,在智能交通领域的车牌识别系统中占据十分重要的地位。该领域研究现有的算法针对特定环境下拍摄的图像基本都能够实现车牌的粗略定位。但是当拍