论文部分内容阅读
笔式交互是多通道交互(Multi-Model Interaction,MMI)的一种重要形态,笔式交互允许用户通过自由勾画、手势等交互方式实现自然高效的交互,逐渐成为人机交互研究的热点。人们对笔式用户界面的需求和研究使得它得到了广泛的应用,包括便携和交互的平板电脑Tablet PC、PDA及其它移动设备,以及电子教学或智能办公环境下的电子白板和电子笔记本等。如何准确的在笔式交互系统产生的手写文档中进行查询、检索和定位是当前笔式交互技术的一个研究热点,必将进一步的推动笔式交互的应用和普及。 本文以一种智能人机交互手写编辑系统为基础产生手写电子文档,并对手写文档中的文字检索方法进行了研究。手写体文档的检索既与手写体文字的识别有相似之处,但同时也有重要区别,主要体现在这种检索需要在开放的集合上执行,而文字识别通常可以看成是在一个事先建立的固定样本集合中查找与匹配。显然前者面临的情况会更复杂。为了有效解决这一问题,本文充分利用时间与空间信息,提出了一种基于笔画距离的手写文档检索算法。 首先对手写文档中的文字进行归一化预处理,然后利用DTW(Dynamic Time Warping)算法计算笔画之间的距离,在此基础上,使用最小近邻优先算法和局部最优算法确定笔画对应关系,最终使用DTW距离计算手写文字的相似度,从而提出了基于笔画距离的手写文档检索算法。 本文的方法不需要训练数据作为先验知识,对不同人书写的文字具有较高的容错能力。该算法在对HIT-OR3C(哈尔滨工业大学中文在线识别语料库)进行测试的时候,取得了较好的效果:对随机选取的一篇在线文档中出现频率最高的100个文字进行检索,基于笔画的DTW距离的检索方法比基于笔画整体距离的检索方法和基于能量弹性网格的检索方法的在准确率上提高了5%~20%,在召回率提高了3%~5%。 与现有的手写输入检索方法相比,本文所提出的方法检索对笔画的随意性容忍程度高,正确率和召回率较高,基本满足实用需求。