开源软件开发者邮件列表中的决策分析与自动识别

来源 :武汉大学 | 被引量 : 0次 | 上传用户:JWPMP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件开发过程中,涉众会针对架构设计、编码、测试和项目管理等做出各种决策,每个决策都会对软件系统产生积极或消极的影响。识别和记录这些决策对于项目开发和维护有着至关重要的作用。一方面可以帮助涉众组织开发中的各类知识、有助于减少知识蒸发。另一方面,有助于涉众对之前做出的决策进行回顾、分析、改进和重用,从而帮助他们在类似的情境下做出更加合适的决策。然而,由于有限的人力、时间和预算,项目中的决策往往没有被很好地记录在文档中。这些决策可能隐式地存在于各种交流平台中,例如问题跟踪系统和开发者邮件列表。此外,随着机器学习和深度学习的不断发展和完善,使用自动化技术从大量的文本中提取有用的信息成为软件工程领域的重要趋势。基于上述研究背景,本文对开发者邮件列表中的决策进行了探索性研究。为了帮助涉众深入地了解软件开发中所制定的各类决策、全面地认识决策过程以及使用自动化方法识别决策,在本文中,我们首先根据纳入和排除标准对Hibernate开发者邮件列表中的9006封邮件进行人工标记,然后从决策表达、决策类别、决策原理、决策方法、相关制品和开发中的决策趋势六个方面对抽取的决策进行分析。最后,我们进行了自动化实验,将文本中的句子分为决策句子和非决策句子两个类别。在本实验中,我们使用了三种数据预处理方法、四种特征提取技术和七种分类算法,共计形成了112种分类器配置。我们评估和比较了所有分类器配置的性能。人工标记和分析决策的研究结果表明:(1)涉众使用三种语言模式表达决策,信息提供、解决方案提供和特征请求;(2)开发者邮件列表中包含了五种决策,设计决策、需求决策、管理决策、实施决策和测试决策;(3)涉众做出决策的主要原因是非功能性需求、功能性需求和管理需求;(4)涉众在制定决策时使用了七种方法,问题构建、约束分析、风险分析、选择分析、归纳推理、演绎推理和折中分析;(5)决策制定过程中涉及了六种软件制品,设计文档、需求文档、贡献者指南、配置文档、发行说明文档和许可证文档;(6)决策贯穿软件开发和维护的整个生命周期。自动实验结果表明,在从文本中识别决策时:(1)在数据预处理阶段,不应进行词干化和词形还原操作,也不应过滤过短的句子;(2)在使用机器学习识别决策时,Bo W技术比TF-IDF技术的整体性能更好;(3)在使用机器学习识别决策时,LR算法的整体性能最好;(4)在使用深度学习识别决策时,Word2Vec技术比Fast Text技术的整体性能更好;(5)在使用深度学习识别决策时,RCNN模型比Text CNN模型的整体性能更好;(6)包含停用词、无词干化和词形还原、不过滤数据集、Fast Text和RCNN组合的性能表现最好(精确率为0.682,召回率为0.926,F1-score为0.785)。
其他文献
血管平滑肌细胞(vascular smooth muscle cells,VSMC)是血管壁中膜的主要组成细胞。正常的血管中VSMC呈收缩表型,分化程度高,呈典型的纺锤形或条带状,高表达收缩型VSMC标志蛋白如血管肌动蛋白相关蛋白(SM22 alpha,SM22α)、平滑肌α-肌动蛋白(smooth muscle alpha-actin,α-SMA)及SM-MHC等。当血管受损时,VSMC可在各种
随着科技的进步和人类认知的不断加深,复杂网络也越来越引起研究者的兴趣.在本文中我们研究了三类替代网络的结构,并研究了它们相关的几个不同的距离指标,如电阻距离,测地距离.通过上述指标,我们研究了所得网络的基尔霍夫指数和加权平均测地距离.第一章,我们简单介绍了复杂网络的研究现状和背景以及加权复杂网络的研究背景.我们给出了电阻距离和基尔霍夫指数的相关概念,并给出了平均测地距离的基础知识.第二章,对于一个
药物性肝损伤指在治疗疾病过程中应用药物时,因药物本身和/或其代谢物具有细胞毒性引起的肝脏损伤。对乙酰氨基酚(Acetaminophen,APAP)是目前广泛使用的解热镇痛药物,在治疗剂量以下使用时是安全的。但是单次过量或长期大量服用APAP则会产生肝脏毒性,过量服用APAP是目前导致药物性肝损伤或急性肝衰竭的主要因素。正常情况下,摄入的APAP中90%会通过葡萄糖醛酸化和硫酸化反应无毒性降解,约5
进入21世纪以来,城市所面临的风险与不确定性加剧,提升城市公共健康韧性,增强居民抵御公共健康风险的能力成为城市研究的重要议题。社区是城市的基本单元与风险治理的第一道防线,面临着传染疾病、自然灾害与环境污染等多种影响居民日常生活的公共健康风险类型,因此提升社区韧性水平是改善城市脆弱性现状的重要措施。近年来,已有研究针对特定公共健康事件展开了大量研究,但如何系统、动态感知社区公共健康韧性,突出居民及社
随着物质水平的提高,全球肥胖症的发病人数越来越多,这也导致了糖尿病的病例大量增加。糖尿病是一种异质性代谢紊乱疾病,而Ⅱ型糖尿病(T2DM)就占其病例的90%以上。胰岛素抵抗(IR)是T2DM主要的症状,而肥胖是造成IR的常见病因。脂肪组织能够分泌几种因肥胖引起胰岛素抵抗的促炎性脂肪因子,促炎因子在肥胖引起IR的发病机制中起到重要的诱导作用。然而针对这些因子展开的治疗效果有限,这表明还存在其他产生胰
纤维素酶广泛存在于生物体内,是一种绿色高效的生物催化剂。然而由于该酶生产成本高且在极端条件下易失活,严重限制了其在工业中的广泛应用。目前,水作为酶的催化反应介质主要存在催化效率低以及长时间催化时酶不稳定的问题,同时分离纯化酶常用的色谱技术存在操作复杂、耗时长及成本高等问题。因此,寻找一种既可作为良好催化介质,又能对酶实现分离纯化的溶剂成为目前极有意义的一项研究工作。离子液体(ILs)和低共熔溶剂(
如今的社会是风险社会。在风险社会中,高等教育肩负着推进技术变革、培养人才和服务社会等重要作用。在高等教育不断发展的同时,风险也随之积聚,随时有可能通过突发事件酿成一场危机。近年来,随着互联网和5G的发展、社交媒体平台的成熟,突发网络舆情事件时有发生,在这些网络舆情事件中,有一部分则是由高校所引发。高校突发网络舆情事件由于涉及校内师生群体,往往更容易引发社会关注和讨论,从而使高校遭到极其严重的影响,
具有类似生物组织“软而湿”特点的智能水凝胶是一种由亲水性功能高分子通过物理或者化学交联形成聚合物高分子链,可通过外界能量场如光,热,PH,电等微小变化与刺激发生的体积相变转而产生驱动力,实现了爬行、抓取等仿生运动的无缆供源与控制,引发了学术界的高度关注。其中,热响应水凝胶如聚N-异丙基丙烯酰胺(PNIPAm)温敏水凝胶在其临界溶解温度(LCST)附近存在剧烈的可逆溶胀-收缩体积相变,利用温敏水凝胶
进、排气噪声是发动机的主要噪声源,安装消声器是控制进、排气噪声的常用方法,消声器一直是研究的热点。从消声器的研究情况来看,人们在消声器内部结构改进上做了大量的研究工作,但出口端对消声器性能的影响没有得到充分重视。声波在管道中传播到管口存在一定的反射特性,使得声波在管口不会全部辐射出去,有部分声波会反射回管内,这一现象有利于提高消声性能,本文研究管口声反射特性对消声器的影响,用于提升消声性能。使用声
学位