基于闭合偏序的API用法模式挖掘

来源 :河北师范大学 | 被引量 : 0次 | 上传用户:f654753936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应用程序接口(Application Programming Interface,API)是当前软件开发中广泛应用的模块化方法。随着软件开发市场规模的越来越大,越来越多的API被开发和使用。但是,大多数API使用规约并没有在API参考文档中说明,程序员需要从网络上搜索相关代码并甄选使用。随着大量源代码的可得和可用,从源代码中挖掘出所需的API用法模式来帮助程序员实现快速高效地开发成为当前研究的热点问题。本文以“偏序集合”建模语句序列,从频繁闭合偏序模式挖掘角度,研究了算法及其对API语料的挖掘效果。主要工作包括:(1)构建了API基准语料库。通过从开源项目资料库中选取带有API用法示例的源文件,建立了用以比较API挖掘算法的基准语料库。该语料库使用代码样例(example)作为正例,解决了挖掘结果没有标准数据集进行对比的问题;(2)对基准语料库进行了预处理。将源代码表示为序列的形式,提出了基于N-gram的序列相似度度量方法并对API方法调用序列进行层次聚类,解决了不同使用场景之间对序列支持度的影响;(3)以偏序集建模源代码语句序列,提出基于分组的闭合偏序(Group based Closed Partial Order,GCPO)挖掘算法。从准确率、简洁性、覆盖率以及算法运行时间几个指标对实验结果进行评价并与CLAMS算法、UP-Miner算法等5个算法进行了比较,充分验证了本文提出的API用法模式挖掘方法的实用性。
其他文献
苯、甲苯和二甲苯(统称BTX)是挥发性有机污染物(VOCs)的重要组成部分。由于其对人类具有高毒性,BTX的去除受到了日益增加的关注。其中催化氧化法被认为是最为经济有效的方法。制备得到低温高活性的催化剂,探究BTX的催化氧化机理是近年来的研究方向。本文采用不同的方法,得到了系列K掺杂的OMS-2催化剂,并以邻二甲苯为目标污染物,研究了K的掺杂位置等对OMS-2催化剂的结构和性能的影响。结合原位漫反
阅读作为主要的信息输入方式之一,是英语教学中必不可少的重要组成部分。英语高考试卷中阅读占比超过四分之一,因此,英语阅读能力对于高中生来说尤为重要。2020年修订版的《普通高中英语课程标准》明确提出必修课程中阅读理解的16条技能,由此可见,如何提高高中生英语阅读理解能力一直是语言研究者需要关注的问题。然而,目前大多数教师仍然过度使用一些传统的阅读教学方法,如语法翻译法对篇章进行逐句翻译,严重影响了对
随着“一带一路”倡议的提出,中国与沿线国家的经济与金融往来日益密切。在越来越多的交流过程中,口译成为非常关键的一环。本文是笔者在2019年10月河北省石家庄市首届“一带一路”国际金融研讨会的陪同口译实践后的反思与总结。在实际的陪同口译中,笔者发现头脑中建立的一些图式可以帮助笔者更好的理解客户的意思,进而更好地完成陪同口译的任务。在报告中,笔者收集了图式理论的相关文献资料,整理了图式理论的基本概念与
随着市场竞争的日趋激烈,电信企业每年因客户流失导致收益下降的问题日趋严重,提升客户体验并挽留客户成为该行业当前的热点研究课题。本文参考国内外电信企业客户体验调查的技术手段和设计模式,对H省电信行业发展现状进行深入调查和分析,构建运营商客户体验实时测评系统。该系统通过分析实时反馈信息,定位客户不满意原因,据此制定合理的挽留策略,提升客户满意度和保证稳定的客户群体,提升其行业竞争力。主要工作如下:(1
目前,通信运营商正处于4G到5G的过渡时期,因受到提速降费的影响,通信行业经济增长缓慢。同时,随着新增客户的市场逐渐缩小,运营商们将目光从新增客户市场转移到存量客户市场。为了维系存量客户,增强竞争力,运营商将重点放在客户生命周期的分析上。在客户生命周期中,客户稳定期是时间最长的,也是最重要的,这关系到能不能把一个新客户发展成一个稳定的老客户。因此,研究客户稳定度,按稳定程度细分客户群是非常有必要的
举世瞩目的2022年冬季奥林匹克运动会将在北京和张家口举行,其中70%的雪上项目在张家口崇礼赛区举行。气象条件是不可控因子,也是影响冬季奥运会能否成功举办的关键因素之一。由于崇礼赛区山峰林立、沟壑纵横,同时气象资料积累较少,因此提高复杂地形下气象预报的准确性具有极大地挑战。除了小概率的暴雪、低能见度、大风、沙尘等高影响天气事件的预报难度较大外,常规要素温度的预报也面临着不小的难度。同时气温的定点预
目的地空间意象是旅游地理学的重要研究领域。地理标记照片具有丰富的时空语义,能解析拍摄时间和地理位置,表征旅游者的景观感知与偏好。因此,大量旅游者发布的地理标记照片为旅游地空间意象提取提供了重要数据源。本文以凯文林奇的城市意象理论为基础,综合考虑旅游时空行为对空间意象的建构过程和新型数据源表征能力,尝试提出一种新的旅游空间意象表征维度划分方式和计算方法,并以著名旅游城市丽江为例进行实证研究。本文主要
高考专业推荐(College Entrance Examination Major Recommendation,MR)是帮助学生快速,准确了解自身对专业喜爱度的一种辅助机制,辅助学生选择报考的专业.在我国,高考关系到一个学生未来的职业发展,始终是一个备受关注的热点,因此高考专业推荐具有广泛的应用前景.由于国情不同,国外学者很少涉及专业推荐,因此专业推荐领域的发展,多是国内学者推进,国内现有的专业
无线传感器网络(Wireless Sensor Networks,WSNs)是由部署在监测区域的智能传感器节点构成的一种网络应用系统,在众多领域有着广阔的应用前景。而节点定位技术是WSNs的关键技术之一,只有正确定位出节点才能得到监测事件的位置,因此节点定位技术具有重要的实用价值。本文重点研究WSNs节点定位算法,并提出以下两种新定位优化算法。DV-Hop(Distance Vector-Hop)
目标检测在计算机视觉任务中占有重要的地位,其主要功能是检测数字图像中实例对象的某个类别,解决目标“在哪里”和“是什么”的问题。交通标志检测是一种典型的目标检测问题,交通标志检测作为汽车智能辅助驾驶系统中重要组成部分,有助于驾驶人员更为科学地决策,解决实际出行中常见的交通问题。本文研究基于深度学习的交通标志检测算法,并结合算法研究成果,面向工程应用的需求,实现嵌入式交通标志检测系统的搭建。1.结合注