PBE技术在文本搜索中的应用

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wildboar2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人们日常的办公过程中,常常需要使用文本编辑器进行文本搜索工作,例如在一篇文档中找出所有来自某一公司Email地址,或者找出所有特定范围内的电话号码等。显然要完成上述功能的基本要求是需要编辑器能够支持通配符查找,所幸目前大部分高级的编辑器都支持通配符查找功能,比较有代表的性有Windows环境下Microsoft Word和Unix/Linux环境下的Grep编辑器。其中Grep实际上提供了对正则表达式(Regular Expression)的完全支持,而Word中所提供的通配符仅是正则表达式的一个很小的子集。正则表达式通常认为是只有少数人理解的一种神秘语言,因为在表面上它们看起来杂乱无章。对于一个普通用户来讲,要想熟练的使用正则表达式来进行文本搜索是很困难的。因此本文要解决的问题就是如何让这种动态的文本搜索问题对用户来讲变得更容易。本文介绍了一个名为SmartTag的智能文本编辑器原型。它的主要思想是通过采用样例编程技术(Programming By Example, PBE),通过交互式的界面观察用户的动作,记录用户输入的数据和动作序列,生成程序以便用户可以将其应用到新的例子中。SmartTag将一个agent嵌入到一个编辑器中,用户将要查找的例子以选中的方式告诉agent,agent针对给定的例子进行推理,将用户给定的例子融合成一个能够覆盖当前例子的正则表达式。同时系统将推理得到的正则表达式以可视化的方式展示给用户,因此用户不必去了解正则表达式的知识。另外,用户还可以手工地对得到的正则表达式进行调整,以使其更加符合用户的需要。这个过程实际上是一个将用户头脑中的思维具体化。SmartTag相对于其他现有方法,对于具有特殊分割符的字符串有更强的推理能力。
其他文献
近年来,随着网络、电信和传感器技术的发展,数据库技术得到了新的应用。在其中一种应用中,数据不再来自存储于永久介质的数据库,而是以连续、快速、随时间变化、无限的数据流的形
工作流高级事务模型往往因为结构过于复杂,或者实现起来过于困难,而很难应用到实际的工作流系统中。而且在目前的工作流产品以及工作流原型系统中,大多都没有对工作流事务即长事
访问控制是网络安全技术中一个重要的研究领域。传统的访问控制机制如自主型访问控制和强制型访问控制,随着应用环境逐渐复杂,已远远不能满足现代系统安全的需求。基于角色的
计算机断层技术(Computer Tomography简称CT技术)的出现极大地促进了无损检测技术的发展。X射线技术迅速发展目的在于不断提高图像信息的准确性和清晰度,但是,仅从二维切片图像
Ad hoc网络(也称移动自组网)是一种特殊的,不依赖于任何固定通信设施的无线网络。Ad hoc网络的特点使得其路由选择机制与其他网络相比更加复杂。传统的因特网组播协议不能适
在数字社会中,软件是一种普遍存在的数字商品。因此软件安全正成为科学研究的前沿,越来越引起学术界和工业界的极大关注。软件安全技术是关于软件工程、信息安全和高性能计算
几何约束求解是计算机辅助设计技术的核心内容。基于图论的求解方法作为求解几何约束问题的最重要的方法之一,其优点为求解速度快,有较低的时间复杂度,因此应用最为广泛。分解分
WebJet业务流程装配平台具有异构、自治、分布式特性和可随企业应用需求而变化的软件环境,实现“半自动软件在线动态装配”机制,使用户能够灵活、简单地基于其需求来组织业务流
为旅客提供安全、方便、快捷的点对点运输服务是民航运输业追求的目标。民航电子客票的迅速普及以及移动电子商务环境的日趋成熟推动了移动电子客票的发展,而安全性是移动电子
数字水印是网络与信息安全方向的一个重要分支,在数字化媒体的信息安全与版权保护方面有着极为重要的应用。目前的研究重点是构造有强鲁棒性的稳健的数字水印算法,这是本文的研