基于Ad-Sim算法的代码克隆检测方法

来源 :浙江工业大学学报 | 被引量 : 0次 | 上传用户:lala601
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代码克隆检测在代码抄袭检测、代码审查、软件更迭和错误检测等方面有重要作用。为提高代码克隆检测的准确率,结合TF-IDF及马尔科夫模型提出了一种改进的Simhash算法Ad-Sim。该算法首先对代码进行归一化预处理;其次在Simhash计算指纹签名的过程中使用TF-IDF计算各关键词权重,并利用马尔科夫模型优化关键词权重;最后比较待检测代码指纹签名的汉明距离相似度,从而判断待检测代码是否为克隆代码。实验结果表明:Ad-Sim算法在代码克隆检测上的准确率及召回率相比Simhash有所提升,尤其在少量代码的检测
其他文献
2014年是中国全面深化改革的第一年,正是在这一历史时期,习总书记提出了媒体融合发展的有关思想,国家也通过了相应的文件,媒体融合发展正式步入中国的历史舞台。在这一历史时
1资料患者,女性,57岁,1个月前无明显诱因下出现下腹部胀痛,时轻时重,在当地医院就诊,行B超检查示右侧附件区多房囊性占位,考虑来源于卵巢的囊腺癌可能性大,大量腹水。转至复
选取65zw30-40污水自吸泵为研究对象,基于Mixture多相流模型和RNGk—ε湍流模型,采用Fluent软件对包含腔体在内的污水自吸泵全流体域进行非定常模拟。结果表明:叶片吸力侧的
目的:分析腹部局限型Castleman病(Castleman’s disease,CD)的超声声像图特征,以期提高对该病的认识及术前诊断准确率。方法:选择2011年7月-2019年11月于复旦大学附属中山医
针对轻触开关在生产过程中外观检测的要求,进行了基于机器视觉的轻触开关引脚外观图像检测技术研究.通过CCD获取图像,采用滤波、阈值分割等预处理提取了轻触开关的二值图像,并采用轮廓提取,根据最小面积包围法获取图像绕中心旋转角度的方法对图像进行矫正,对旋转后的图像提取4个引脚区域的ROI区域.对提取引脚区域的黑色像素面积进行统计,并与设定的标准面积阈值进行对比判断进行轻触开关引脚外观缺陷的检测.实验结果
目的:探讨肺原发性小细胞神经内分泌癌(lung primary small cell neuroendocrine carcinoma,LSCNC)的CT与PET/CT表现,以提高对该病的诊断水平。方法:回顾并分析61例经病理学
1资料患者,男性,31岁,间断头晕3年,加重1月余。患者于2015年出现无明显诱因头晕,多发生于头后仰时,可自行缓解,无头痛、恶心、呕吐及视物模糊等,因上述症状加重2018年6月于解
用多窗谱估计和伽马通滤波改进经典的梅尔倒谱特征(MFCC)的识别性能,并与delta特征相结合,提出了一种基于加权参数设置策略的混合特征话者识别算法.该算法解决了梅尔倒谱系数方
目的:探讨超声引导下经会阴前列腺8针穿刺活检中不同穿刺部位前列腺癌的检出率,以期为前列腺癌最佳穿刺方案的选择及前列腺癌的诊断提供帮助。方法:回顾并分析2015年1月—201