一种针对GitHub软件开发过程日志的划分方法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:pioneerp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的普及,软件产品正深入人们的日常生活,对软件产品质量提出了更高的要求。如何快速开发高质量的软件正成为现代软件开发的难题,而开源软件提供了很大的便利。GitHub是目前最大的软件开源社区,许多软件项目依靠软件工程师、开发者之间的讨论决定软件未来的走向,没有固定软件过程模型的指导。软件过程模型对于指导和管理开发高质、高效的软件产品有一定的重要作用。目前,软件过程建模己经从传统人为建模的方法转变为自动地从己经拥有的海量软件过程数据中挖掘出软件过程模型的方法。然而GitHub开源软件开发过程数据具有一定复杂性,存在不可避免的单实例性问题,挖掘具有一定难度。现有的过程挖掘技术不能直接适用于GitHub软件开发过程日志挖掘。本文针对GitHub上软件开发过程提交日志增加标签,根据语义活动信息将日志数据抽取为事件序列;在全局序列的视角下对日志进行划分,提出了一种基于全局计算活动间关系的方法判定日志划分活动,将划分的多实例作为实例信息,运用过程挖掘算法对划分后的多实例信息可以挖掘出软件开发过程模型。实验使用真实的GitHub上开源软件提交日志数据,详细的介绍了GitHub开源软件开发过程日志的获取、格式以及如何将单实例事件序列转化为多实例。实验表明对日志形成的事件序列全局划分方法可行,证明该方法思路具有可行性、正确性。本文研究中的主要工作有以下几点:(1)开拓了对GitHub开源软件开发过程挖掘研究的新思路,新方法;以日志为着手点剖析数据,按层次对日志提取信息;(2)解决GitHub软件开发过程日志的复杂性问题,通过对日志的结构化、序列化处理,使日志能够有效的进行关系计算,同时保证了活动挖掘的可行性;(3)从全局的视角下判定日志划分活动,增加了全局计算,减少划分尝试,提高划分的效率,有效解决单实例问题。
其他文献
家族信托作为我国财富管理市场上新兴的一项业务,高净值人群对此颇为关注。然而,我国信托业目前以自益信托、资金信托为主导,家族信托并非是一个法律概念,由于法律对什么是“
无线感知技术是通过采集,处理与分析泛在的无线信号,并从中挖掘出其传播环境中诸如身份、手势、动作等目标信息的一种新兴技术。得益于无线信号的物理特性,无线感知技术可以
图像分割是依据一定的相似性准则将图像分为几个有意义的、互不重叠的区域的一种图像处理办法。在同一区域内,图像的特征(如灰度、纹理、色彩)是相似的,而在不同的区域内,图像的特征则明显有所不同。阈值法因其简单实用的优点成为最常用的图像分割方法,但是它只利用了图像的灰度信息,在某些情况不能得到理想的分割结果。研究表明,同时考虑图像的灰度信息和像素间的空间相关性有助于改善分割结果,将像素之间的空间相关性引入
在计算密集型批处理任务中,有一种任务运行时间很长、且要占用大量CPU和内存资源,例如基因测序任务。对于该种类型的任务调度策略来讲,任务完成时间是衡量调度策略好坏的一个重要指标。在任务大小和数量一定时,任务完成时间越小,系统服务质量越高。设计了一种面向计算密集型批处理任务的调度系统。该系统采用一种混合改进遗传模拟退火算法(Improved Genetic Simulated Annealing,IG
主客体化学是超分子化学领域的核心内容,分子自组装是超分子化学的最终目标,现在超分子化学在这两方面的基础上均取得了快速的发展。设计和开发具有大尺寸空腔和特定功能性大
随着互联网技术的发展和开源社区的兴起,开源代码的数量急剧增加,从开源社区中发掘出有用信息需要耗费大量的时间和精力。自动摘要技术广泛地应用于文本主要内容的获取,但针对代码的相关技术研究较少。本文使用深度学习思想解决这一问题,利用卷积神经网络(Convolutional Neural Networks,CNN)模型提取代码特征,从而缓解信息爆炸带给人们的时间精力问题。本文对代码自动摘要问题进行了分析,
提到近代日本的思想一定会涉及到脱亚论。但是,在同时代“日中连带”和“亚洲只有一个”等兴亚思想多为民间人所讨论。这些思想多为早期亚洲主义的思想。亚洲主义思想在19世
图像分割作为图像处理技术中基础步骤,是能够将图像划分成具有各自特性的区域并能将感兴趣的区域提取出来的技术。图像分割结果会直接影响图像处理中的图像分析和图像理解步骤,因此,对图像分割技术的研究具有重要意义。在传统的分割算法中,大多是以单个像素为处理单元,所以分割方法计算效率低,分割效果差。因此以超像素代替像素的分割方式得到了发展,降低运算成本。本文在超像素的基础上,通过图像预分割和超像素融合两个阶段
进入了大数据时代之后,各行各业的需要处理的数据越来越多,视频数据尤甚。在视频算法出现之前,一直都是靠人工对视频数据进行处理。显然,人工对视频数据进行处理与分析需要耗
薯类作物采用机械收获时,会产生机械损伤。这些机械损伤因为收获环境复杂,薯类形状各异等限制一直没有很好的智能化检测方法。本文针对薯类的工业检测背景进行机器视觉检测的