基于刻面和聚类分析的构件检索算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:guoqiang113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开发复杂的大型企业应用软件正面临着严峻的挑战,为此人们提出了多种技术手段来改善软件开发的效率和质量。软件构件技术不仅能够改善软件在生命周期中各阶段的综合效益,而且还能大幅度地提升产品质量和生产效率及通用性和开放性,因而受到了多数人的重视。然而,随着基于构件的软件工程的不断发展,软件构件的数量逐渐增加,构件库的规模急剧扩大。针对如何从规模庞大的软件构件库中快速且高效地检索出目标构件的问题,本文提出了一种基于刻面分类和聚类树的构件检索方法,该方法主要包括以下几个部分:(1)解析构件描述。基于刻面分类法多面分类机制,结合Web Service的服务需求,使用领域术语和刻面术语组成构件标识集合对构件的描述进行特征词提取,采用一组特征词表示构件。(2)构件向量化建模。根据特征词权重计算公式,将特征词表示的构件转换为权重表示的构件向量,从而使构件匹配问题转化为计算构件向量的余弦相似度。(3)构造构件聚类树。把构件库中的构件按照层次划分,从上到下逐层细化构件的分类,对子刻面下的构件进行语义相似度的聚类,建立构件聚类树,优化构件库的组织结构。(4)建立构件检索算法模型。提取用户描述的检索条件中的特征词,转换为检索构件向量,通过计算构件向量之间的余弦相似度,实现构件的模糊匹配;计算检索构件与聚类簇中心的语义相似度,将拥有最高相似度的聚类簇作为候选检索结果,有效地减少了构件匹配的次数。使用构件标识集合对构件描述,能够克服传统上单纯采用刻面分类法对构件分类描述和检索时带来的主观因素的影响。引入聚类树的思想,通过计算构件之间的语义相似度对构件聚类,建立构件聚类树,能够有效地缩小检索范围。对比实验表明,基于刻面分类和聚类树的算法能够提高构件检索效果,使得平均查准率达到88.3%,平均查全率达到93.1%。
其他文献
远程教育是当代教育领域中不断演化出一种新的教育形式,在互联网教育平台的推动下使得这种教育形式蓬勃发展。本文所研究的人眼定位算法为远程教育系统中监测模块提供了人眼
磁力齿轮相较于机械齿轮,可以实现无接触传动,具有无摩擦、免维护并且可以实现过载保护等优点。但现有磁力齿轮的内、外转子上均安装有永磁体,当应用于电动汽车的主减速器中并处于高速和重载工况下时,其转子上的永磁体材料因脆性大抗拉极限强度低,受到高速旋转产生的离心力以及工作载荷的共同作用会有发生碎裂的风险。为了解决上述问题,本文根据游标磁阻电机的工作原理,提出了一种车用磁阻式磁力齿轮减速器。该磁阻式磁力齿轮
增强现实是计算机视觉、计算图形学等领域中的一个热点研究方向,增强现实系统通过将计算机生成的虚拟信息融合显示到真实环境中,可以增强用户对真实环境的感知与交互能力。实
自然语言处理研究主要有词法分析、句法分析以及语义分析,句法分析是哈萨克语现阶段的研究对象,在句法分析之前已经完成了词干提取、词性标注以及组块的研究工作,句法分析的
当今社会,突发事件对公共安全的深刻影响已经无法成为一个视而不见、避之不谈的话题,它不仅发生时间不可预知,其所产生的范围、跨度以及传播的速度在目前也有着较高的提升,不
系统工程集系统、控制、信息等学科相互交融,在康复医疗领域有广泛的应用。上肢康复机器人融合了临床康复医学与辅助康复学,为卒中患者的上肢康复提供了新的技术路径,其研究
ITER电气测试中心电流传感器稳态测试平台用于测试电流传感器在双向稳态大电流下的输出特性,该测试平台120 kA稳态电流测试能力不仅能满足现有40 kA电流传感器的测试要求,也
热电阻是中低温度区常用的温度检测仪器,铂电阻凭借性能稳定和测量精确度高的特点,被制成基准仪,广泛应用于工业测温。为了确保热电阻在出厂和使用过程中测温的准确性,要求对
人们对随时随地和快速移动宽带上网的需求呈现出前所未有的增长,曾经单一的网络服务早已无法满足人们当下的需求。为了适应人们日益增长的需求,提出了异构网络融合。为实现异
铋系光催化剂材料通常具有合适的价带位置和强的空穴氧化性,在有机污染物的光催化降解领域展现出潜在的应用价值。与传统的单组分铋系光催化材料相比,三组分材料具有更快的光生电荷分离效率,因而表现出显著提升的光催化活性。另一方面,多组分过渡金属磷化物因具有独特的电子结构、丰富可变的价态、良好的导电性、较高的机械强度、以及著名的协同催化效应等,在酸性或碱性条件下均表现出了优异的HER和OER活性,被认为是最有