面向源码的功能定位技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:amavis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年开源项目的发展,个人通过互联网能获取到越来越多的工程代码。在缺少需求和设计文档的情况下,想在短时间内仅凭阅读代码来理解工程功能模块组成或某一功能对应的代码十分困难。而当前的源码搜索引擎只能按查询词搜索与之匹配的代码片段,却无法在将查询词视为功能描述的基础上,从宏观角度给出涉及的结构信息。因此本文研究如何根据功能描述在源码工程中定位相应的类结构等信息。为解决该问题,本文提出了一种结合软件聚类的功能搜索技术,使用主题分析和软件聚类,该技术能得到较为精确的类结构信息。该方法包含三方面工作。首先,提出了针对Java的软件特征提取方法和特征向量构造方式。构造的特征矩阵作为层次聚类算法的输入,输出相应的簇描述。然后,提出了针对类结构的主题分析方法。该方法不以文件为单位,只针对类结构信息分析。由此搜索得到的将不再是代码片段,而是和功能相关的一系列类结构信息。最终,综合利用软件聚类和主题分析实现了功能搜索技术。此过程使用软件聚类的结果指导主题分析,主题分析的输出经过软件聚类过滤,最终展现给用户更加精确的信息。照此方法,本文设计并实现了一个原型系统。实验表明,该原型系统能有效提升软件聚类的结果。和GitHub字符串匹配结果相比,在搜索功能上得到数据更加精确,能自动化地排除不相关结果,得到良好的功能模块结果。在应用前景上,该方法在实际的阅读源码、维护系统方面都有很好的指导作用。开发者可以借此方法来指导先期探索,加快理解工程,提升开发效率。进一步的发展,可以借此方法完成功能模块的复用。
其他文献
依据复合材料结构设计原则和强度设计理论,提出了某飞机舱门复合材料设计方案。并采用有限元分析方法对多种复合材料铺层方案进行仿真计算,最终获得最优设计方案。计算结果表明
“供给侧改革”成为“两会”热点之一。供给侧改革大势之下,身处市场供给方的互联网企业格外引人关注。能否利用自身科技实力,提高供给效率成为市场关注焦点。京东公共采购模式
报纸
2014全球互联网投资趋势报告企业信息化正在面临变革,传统企业IT服务正在向"新IT"转型。这种转型主要表现在三个层面,一是从桌面转向移动+桌面,二是从企业级应用软件转向SaaS服
目前,中国社科院发布《2013中国企业社会责任蓝皮书》,根据市场、社会、环境等指标确定社会责任排名。①国企前三:国家电网、南方电网、中国石化;②外企前三:韩国三星、美国英特尔
瑞士健康观察机构日前发布调查报告称,约六分之一的瑞士人受轻度抑郁症困扰。
新一代豪华电动汽车TeslaModelS是一款全新概念的车,但若乔布斯还活着,他一定会对这款车嗤之以鼻,乔布斯生前未完成的事业就是打造一款颠覆传统概念的汽车——iCar。在中国人的
指出了网络的快速发展为人们行使言论自由的权利带来便利,但同时也带来了很多的负面的影响,如网络暴力。基于此,分析了网络语言暴力形成的原因,并探讨了相关的防治对策,以期
化疗是治疗肿瘤的主要方法之一,化疗药物具有很强的细胞毒作用,临床上常伴有不同程度的毒副反应及组织、脏器的损伤。因此,化疗病人的护理是完成化疗计划的保证。
时代的脚步在不断的前行,从小农经济时代,到工业经济时代,一直到今天的互联网+时代。每一个时代的变化都带来了商业生态的剧变。今天我们已经步入创新2.0的互联网+时代。这个
随着经济的发展及我国企业规模的逐渐扩大,财务管理难度不断增大,传统的财务管理模式已不适应当前企业各种业务发展的需要。随着科学技术的发展,很多企业都实现了财务信息化