类型检查中的正则表达式相交判定与包含判定

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:ashwingangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML由于简单灵活和良好的可扩展性,在网络服务、关系数据库以及形式化研究等领域得到了应用。随着XML处理技术的不断发展,近期的研究表明静态类型化处理方式在XML处理时具有重要的优势。在静态类型化系统中,XML的模式语言被当作程序的基本类型,在编译时静态地检查子类型关系,以确保程序运行时的类型安全。在很多情况下,XML类型检查与XML模式语言中的正则表达式的包含判定有很大的联系。   在针对产生式不相交的正规树文法的XML类型检查中,需要对正规树文法的产生式进行相交判定。基于正规树文法的产生式的构成特点,本文提出了基于自动机的产生式相交判定算法。根据产生式的内容模型即正则表达式,构建相应自动机,然后判定两个自动机的交是否为空,算法的时间复杂度为O(‖E1‖·‖E2‖·|∑E1∪∑E2|)。实验数据表明,该算法是可行的,可以应用到针对产生式不相交的正规树文法的XML类型检查中。   本文还研究了正则表达式的包含判定算法。正则表达式的包含判定是XML类型检查中的一个重要问题,目前主要有基于自动机(DFA)、基于正则表达式推导、基于正则表达式Header-form推导等三种算法。其中,前两种算法主要针对的是one-unambiguous正则表达式,第三种算法则可以针对普通的正则表达式,只是在某些情况下,该算法无法对某些非one—ambiguous正则表达式进行包含判定,这时该算法会报告此问题。本文实现了以上三种算法,并通过实验对比分析了三种算法的实际运行效率,在此基础上,本文针对正则表达式的包含判定问题,提出了一个综合的包含判定算法。该综合算法可以针对普通的正则表达式进行包含判定,并且针对输入的正则表达式的部分子集,采用了实际运行效率更高的包含判定算法(上述三种算法之一),因而在一定程度上提高了算法的整体运行效率。本文同时实现了该综合算法,且通过的相应的实验证明了该综合算法的可行性。
其他文献
飞速发展的计算机系统应用不断对处理器计算能力提出更高需求。面向特定应用的处理器扩展技术主要包括指令系统扩展及专用硬件加速部件扩展这两种方式,可有效提高特定应用的性
在网格计算中,任务管理、任务调度和资源管理是网格必备的三个基本功能。网格调度技术解决了网格如何调用各个资源,如何实现协调工作等问题,一个好的任务调度方法可以充分利用网
EPA标准是由我国提出的用于提高工业以太网实时通信性能的系统规范,其为了解决EPA网络中设备之间的互通问题,定义了应用层的服务与协议规范。它通过在数据链路层和网络层之间添
在过去三十年间,随着成像光谱技术的不断发展,在飞机或卫星平台上搭载的成像光谱仪采集得到的遥感图像包含了越来越丰富的空间、辐射和光谱信息,从而为地表物质的信息提取和目标
A.Shamir在1984年首次提出了基于身份的密码学的概念,其根本目的是简化传统公钥密码学中复杂的证书管理.在基于身份的密码体制中,公钥不再需要通过可信第三方签发的数字证书与
各类设备与控制系统的日益复杂对其故障诊断系统提出了更高的要求。一方面,故障诊断系统面临着海量监测数据的输入;另一方面,随着故障种类、发生形式呈现越来越明显的多样化,
用户界面在软件系统的智能化、个性化、人性化等方面发挥着重要作用,但却是软件系统中最容易变化的部分,因此使用户界面具有可定制性是计算机软件技术领域中一个重要问题。同样
随着摄像技术的发展,图像的清晰度越来越高,人们在对图像中的物体进行检测时的要求也越来越高。在复杂的图像中目标往往彼此干扰,检测的图像和实际就会产生偏差,采用亚像素的方法
作为确保软件质量的重要途径,软件测试一直是人们研究的热点问题。每一个软件都可以看作一个受若干参量影响的逻辑系统。对于一些复杂系统而言,影响其运行的参量数目一般较多,对
对非合作空间飞行器进行轨道确定是开展空间探测、轨道监测和态势感知等空间任务的前提之一。本文针对非合作空间飞行器轨道确定过程中涉及的问题,在总结现有轨道确定方法的基