论文部分内容阅读
在当前国家建设和谐社会的背景下,控制国民经济命脉的各领域信息系统越来越受到重视。需求分析是信息系统开发的起点,对整个开发的成败有着重要的影响。当系统需求存在缺陷时,无论系统设计和实现过程是否完善,实现的系统都必然存在缺陷。如何验证信息系统需求与国家法律政策、行业法纪法规的一致性,以及验证信息系统需求内部的一致性,已成为需求工程研究领域的一个重要研究课题。本文的研究工作主要围绕需求一致性验证技术展开,重点研究基于自然语言需求文本的需求一致性验证技术。当需求以自然语言形式存在时,直接应用各种自动化方法进行需求检查是不可行的,必须先对需求进行形式化。本文以自然语言需求子句为树结点构建了一种需求树模型。模型基于给出的汉语语言需求词汇切分算法,将需求子句划分成若干需求关键词,并提出了一种需求关键词七元组表示方法。通过构建领域规范词表,确定了七元组表示的规范词和外语义相似度。关键词七元组表示的提出使需求树结点从需求子句转化成了需求关键词集,所构成的细化需求树模型实现了对自然语言需求文本的预处理操作。提出了一种需求依存分析树模型,以解决细化需求树不能表征需求子句句法结构和需求关键词词间关系问题。基于给出的一种基于分析树的依存关系标注算法,论述了一种从细化需求树结点到需求依存分析树模型的转换方法,并提出了一种需求依存分析树的建树与更新算法,从实验结果看,算法优于同类算法。模型转换过程中通过词性回收进行了需求关键词去词操作,并讨论了转换过程中需求二义性的发现和消除方法。需求依存分析树模型可精确的描述需求子句句法结构和词间依存关系。提出了一种概念从属森林模型,以解决需求依存分析树模型不善于表达隶属于不同需求子句的词间关系问题。并提出了一种概念从属森林构建与更新算法,并给出了在更新过程中识别需求遗漏性的方法。经实验分析,算法具有接近线性的时间复杂度。归纳了森林操作,给出了一种森林操作提取算法,算法对需求依存分析树集进行遍历和二阶动词子树提取,所提取的森林操作函数可用于表征隶属不同需求子句的词间关系。提出了需求关键度的概念和计算方法,以提高需求检查结果的确认率。构建了外语义相似度向量,基于依存分析树模型给出了一种局部重要性比例标度填充算法,并依据填充内容构建了判断矩阵,提出了一种需求关键词权重向量的计算方法。基于概念从属树模型给出了一种全局重要性比例标度填充算法,使需求关键词七元组数据满秩,并基于填充内容给出了需求关键词重要性标度向量的计算方法。基于以上三种向量的构建,提出了一种需求关键度计算方法,并提出了一种基于需求关键度的需求树与需求依存分析树剪枝算法。算法不但能提高需求检查结果的确认率,而且缩小了算法状态空间,提高了各种需求检查算法的执行效率。提出了需求相似度和相关度的概念和计算方法,以解决概念从属森林模型不能直接表征不同需求子句句间关系的问题。基于概念从属树模型,给出了对从属结点概念从属强度和非从属结点内语义相似度的计算方法,并进一步给出了一种用于判定需求子句概念结构相似程度的需求向量相似度计算方法。基于需求依存分析树的动词骨架,提出了一种用于判定需求子句句法结构相似程度的需求依存相似度计算方法。基于概念从属森林操作模型,提出了一种需求相关度计算方法。基于相似度和相关度计算,提出了一种需求一致性检查算法,算法通过对相似属性的属性值、属性值域和相关属性的属性等式结果进行比较,可确认不同需求子句的句间关系,并且能检测出需求冗余性和矛盾性等需求不一致性的存在。