基于模糊形式概念分析的程序聚类及演化分析

来源 :复旦大学 | 被引量 : 0次 | 上传用户:mzhou2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件系统的演化分析是程序分析和程序理解的一个重要方面。通过演化分析可以了解系统需求和设计的演化趋势,从而更好地理解系统的需求和设计决策。针对不同版本代码的系统演化分析首先要求获取每个版本的高层结构信息,然后建立不同版本结构之间的映射,并据此得到版本之间的差异,从而发掘系统高层需求或设计上的演化信息。为了实现演化分析,本文首先通过程序聚类方法逆向恢复各个版本的高层结构。程序聚类通过将与特定需求或设计元素相关的程序单元进行聚类以形成高层结构,从而辅助进行程序理解和可复用资产抽取。基于代码的程序聚类在软件逆向工程中有着大量的应用,对于需求和体系结构模型逆向恢复以及构件抽取都有着重要的作用。其中,传统的形式概念分析——Formal Concept Analysis(FCA)是一种广泛使用的聚类方法,分析对象包括语法结构、程序运行轨迹以及代码中的文本信息等。传统的FCA都是基于二值布尔属性(具有或不具有)进行分析的,然而实际的程序分析经常存在对于高层结构恢复具有重要意义的多值甚至模糊属性。针对这一问题,本文提出使用模糊FCA来进行基于文本分析的程序聚类,并设计了一个基于模糊FCA的程序聚类方法。该方法包括模糊属性的采集过程以及一个完备、无冗余的模糊概念格构造算法。在针对各个版本得到的模糊概念格基础上,本文进一步提出了一种基于树匹配的软件演化分析方法。该方法利用基于概念相似度度量的松弛树匹配的方法建立不同版本概念格中概念和概念子格之间的映射关系,在此基础上通过结构差异分析来发现各种演化类型。最后在一个商业软件——书店管理系统上应用文章提出的程序聚类及演化分析方法。实验表明,该方法能够有效地发现不同版本之间的高层演化信息,有助于开发人员理解系统的演化历史以及相关的设计决策。
其他文献
随着信息技术的快速发展,数据量出现爆炸式增长。为了高效存储这些大量的数据,存储区域网FC-SAN(Fiber Chanel Storage Area Network)和IP-SAN (Internet Protocol Storage A
可信计算增强了平台的安全性,能够以更安全地方式去完成任务。可信计算中认证协议是十分关键的,作为平台可信的身份认证协议,直接关系着可信平台的安全性和健壮性。认证协议
图像超分辨率重建技术是指由已有的低分辨率(Low Resolution,LR)图像重建出一幅相对应的高分辨率(High Resolution,HR)图像。这项技术能够实现在不改进成像设备的硬件条件的
随着网络技术飞速发展,网络规模日益扩大,网络复杂性不断提高,影响网络服务质量的因素也逐步增多,这对网络管理提出了新的挑战。在网络管理中,往返时延、延迟抖动等时间测度具有非
随着计算机、互联网技术的不断发展,几乎所有的文本、图片、音频、视频等多媒体都能够以数字化的形式存在和传播。数字化作品容易传播和复制,这就给数字作品的内容安全、产权
本文致力于研究基于XML的数据库中间件(本文中命名XMLDBMW)的设计与应用问题。它能为应用程序提供便利的XML与关系数据库的双向访问。本文首先探讨了XML的特点、优点和发展趋
机器翻译的研究近年来取得了重大进展,尤其是统计机器翻译。它解决了从大规模语料库中获取大量细粒度翻译知识的问题,并为多种复杂因素下的译文优选提供了合理的解决办法。目前
学位
随着虚拟化技术的普及,如何有效地监控多个物理计算节点以及部署在这些物理计算节点上的数百乃至数千台虚拟机是虚拟机管理的难点。目前存在着许多功能强大的虚拟机管理软件,
互联网的快速发展和普及,某种意义上改变了人们的生活。然而,越来越多的不良信息给人们尤其是未成年人的身心健康带来了很大的危害,为了保护广大未成年人免受其害,网页过滤有