论文部分内容阅读
随着互联网和云计算的不断发展,Web服务技术逐渐成为当前的一大研究热点。在Web服务技术众多研究主题中,可信Web服务发现已成为国际上亟待解决的重要课题。对于部署在分布、开放、多变、难控网络环境下的海量Web服务,如何保证其能够正确、安全和快速地为用户提供满足其需求的可信服务显得尤为重要。因此,进行高可信的Web服务发现研究具有一定的战略性、基础性和前瞻性,对我国软件业发展具有重大意义。本文通过引入机器学习领域中的核基学习、度量学习和稀疏学习理论,结合自组织映射(Self-Organizing Map,SOM)神经网络和分类器正则化技术,以基于WSDL(Web Service Description Language)语言描述的Web服务为研究对象,对可信Web服务发现领域中的若干关键问题进行了研究,并取得了一些成果。论文主要工作集中在以下几个方面:(1)提出了一个基于WordNet和概念语义降维的轻量级语义Web服务发现模型。该模型通过引入WordNet和隐含语义索引技术对Web服务进行轻量级语义特征提取,使得低维紧致的服务表示向量具有更符合其真实语义的特征描述;同时,为了更好地评价真实Web服务的相似性,该模型还引入了一种基于核基相似性度量的Web服务匹配机制,克服了传统服务匹配机制忽略样本分布统计特性的局限性。(2)提出了一种核Batch SOM神经网络学习算法,并由此构建了一类核Batch SOM神经网络聚类优化的Web服务发现模型。该模型通过对Web服务进行自适应聚类管理,将功能相同或相近的Web服务聚合在一起,从中抽取类标识服务来辅助Web服务的注册、查找等,可以大大缩小服务搜索的匹配空间,从而提高服务发现的效率。(3)提出了一种Web服务有监督特征提取和自适应相似性评价机制。首先通过引入逆类别频率改进传统的无监督术语加权机制,提出了一种融合类先验信息的有监督Web服务特征提取方法;其次通过引入大间隔度量学习理论,提出了一种基于类先验信息的服务相似性度量学习方法。这两种方法都能有效区分样本特征的相关性和无关性,合理揭示数据的内在分布结构。由此构建的基于有监督服务表示和自适应相似性评价的聚类优化Web服务发现模型验证了这两种方法的有效性。(4)提出了一种基于结构化噪声矩阵补全的可信Web服务QoS预测机制。首先通过引入L2,1范数正则化技术将Web服务Qo S预测问题建模为一类结构化噪声矩阵补全问题。其次,为了有效地求解该结构化噪声矩阵补全问题,提出了一种基于算子分裂技术的结构化噪声矩阵补全算法(OSMCSN)。真实数据集上的实验结果表明,OSMCSN算法不仅可以显著提高Web服务Qo S预测精度,还能准确探测出采样矩阵中的噪声行位置信息,从而实现对操纵和篡改Qo S信息的不诚实用户进行预警。(5)提出了一类多值多对多高斯联想记忆神经网络模型,并且对该模型的渐近稳定性,存储容量和纠错能力进行了分析。基于联想的图像检索应用证实了该模型的鲁棒性能。特别地,由于概念语义网络是体现Web服务语义和智能的重要载体,其联想和推理能力直接关系到Web服务的查询精度及组合效率,因此,将该模型应用于Web服务概念语义网络的智能管理将是我们下一步工作的研究重点。