序列模式挖掘在软件开发信息库中的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wheatsnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术水平的提高和社会信息化的发展,各行各业对软件的需求不断增加,随之而来的是数据量的成倍增长和功能的不断细化。为了满足新的需求,软件开发人员需要不断的更新来完善系统,增强软件的生命力。但如今的计算机程序越来越庞大,环境变化也很频繁,加之各种文档的缺乏,使软件更新变的十分困难。在软件更新过程中,涉及最多的就是源代码的修改,软件开发人员在更新软件系统时,经常需要跨模块的修改大量的源代码,而人工的从庞大的系统中找出每一个修改文件是非常耗时的,因此设计一个可以确定源代码文件相互关系的工具是十分必要的。序列模式挖掘技术是数据挖掘技术的一个重要分支,被广泛的应用在各个领域,它可以从大量的历史数据中挖掘出隐含的、有用的信息。软件开发信息库是软件开发过程中所有相关数据总和,存储着大量的项目开发过程数据、源代码数据、相关文档等。本文设计的系统就是以序列模式挖掘技术为基础,挖掘软件开发信息库。本文研究了序列模式挖掘的经典算法,对这些算法进行了比较。实现了PrefixSpan算法,在实现过程中,综合了对投影数据库存储优化和扫描优化的建议,提高了算法的执行效率。本文设计的代码分析系统,在从Subversion中获取日志信息后,提出了三个分组准则对数据进行处理,之后对不同的分组数据进行挖掘,最后做了对比分析,不仅帮助软件开发人员提供了相关修改的建议,而且加深了软件开发人员对程序的理解。本系统同时提供XML格式的输出方式,在此基础上可以方便的进行二次开发。
其他文献
物流配送作为物流体系中最基本的业务环节,关系到物流企业的效率与效益。物流企业通过制定完善的配送计划来为客户提供及时有效地服务。但是在实际的物流活动中,车辆路径条件
随着移动通信业的发展以及计算机网络的成熟,融合通信的概念开始被人们提及,并成为了一种新的通信模式。即融合计算机网络与传统通信网络在一个网络平台上,实现电话、传真、
光纤通信技术的迅速发展对光纤网的自动监测和维护提出了越来越高的要求。本文在分析了光纤通信的基本原理的基础上,论述了光纤自动切换保护设备及远程监控系统的设计开发机
随着P2P网络的兴起,构建高扩展、高可靠、高性能的分布式计算系统成为近年来的研究热点。任务调度是P2P计算中的一项关键技术,直接影响到整个系统的计算性能。P2P任务调度是
无线网络技术是当今世界最热门的技术之一,得到广泛应用。随着无线通信技术发展及功能强大的无线终端设备的普及,无线网络的应用领域日益拓广,涉及军事、民用等诸多方面。相
免疫系统是目前已知的最精妙复杂的身体抵御外部有害物质的系统,它犹如一支训练有素的精锐部队,捍卫机体的健康。免疫细胞会对入侵者产生记忆,当下次同样的抗原入侵时,便以此
在面向服务的体系结构中,追求快速、高效且安全地建立服务协同往往是不够的。面对动态的现实环境,服务协同经常会受到各种异常的干扰,因而,服务协同的维护至关重要。本文以准
本文以国家863计划“新一代高可信网络”重大项目“基于宽带网络的旅游智能导航系统研究”为科研任务,设计并实现了旅游导航与救援系统的服务器端,论文完成的主要工作如下:(1)
随着无线移动设备的普及,各类多媒体应用越来越广泛。多媒体业务流对数据传输具有较高的要求,例如,实时语音通信业务就对时延和抖动都提出了极高的要求。因此,移动Ad Hoc网络
伴随着网络信息科技时代的来临,三维虚拟人建模技术在计算机视觉、影视制作、游戏设计等很多领域都有着越来越广泛和深入的应用。因此如何获得更加真实的三维虚拟人模型,并有