基于知识图谱与词嵌入的Web服务发现研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:ghchao0605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web服务作为一种可重用、松耦合的分布式计算模型,近几年得到学术界和工业界的广泛关注。Web服务存在服务描述稀疏、语义表达模糊等问题,Web服务描述稀疏的现象导致用户不能准确高效的查询出满足个性化需求的Web服务,如何准确而高效地找到符合用户需求的Web服务是制约Web服务应用发展的关键问题。目前针对于语义稀疏背景下的Web服务发现研究相对较少。为了解决Web服务中存在的语义稀疏问题,本文提出基于知识图谱与词嵌入的Web服务发现方法。(1)一种是基于知识图谱同义词扩充的主题分布模型,首先对Web服务特征预处理,包括对服务名、服务标签、服务描述等进行分词、词性还原以及过滤停用词等操作;然后利用知识图谱wordNet将预处理后的Web服务文档进行同义词扩展,使服务描述语义更加丰富;最后通过LDA聚类算法对扩充的文本进行聚类,将服务组织到不同的潜在主题;根据检索词向量和主题词向量进行相似度比较,将同一主题的Web服务筛选出来推荐给用户,提高Web服务查询的查准率和查全率。为了验证模型的有效性,利用公共测试数据集OWLS-TC中真实注册的Web服务数据对两种模型设计了多组对比实验,实验结果表明,经过语义扩充后的Web服务语义更加丰富,描述更加具体,相比于传统关键字查询方法,查准率提高了 10%左右,实验结果证明了提出算法的有效性。(2)另一种是基于语义相似度的词嵌入主题模型,首先利用训练模型word2vec对服务描述的特征词汇进行词向量训练,得到连续词向量集合;再通过计算词向量之间的相似度筛选出相似度较高的词汇对文本进行语义扩充,扩充后的Web服务文档语义更加丰富;然后通过遍历用户查询的每一个特征词,将特征词映射为词嵌入,使用Gaussian LDA聚类算法将同一主题的服务组织聚类到一起,Web服务查询效率更加高效。实验结果表明,基于语义相似度的词嵌入主题模型查准率和查全率都有一定程度的提高,相比于知识图谱同义词扩充,word2vec语义扩充效果更加理想,查询效率更高。
其他文献
近年来三维扫描技术得到了飞速发展,点云数据的获取变得方便快捷。由于点云具有物体深度信息,越来越多的学者开始关注使用点云进行物体识别。在对国内外研究现状进行总结和研究后,论文对固定、非固定场景分别提出两种识别算法,针对点云滤波、法线计算、关键点提取、特征描述、特征匹配等多方面提出改进,通过与常用识别算法进行大量对比实验验证本文识别算法的准确性、鲁棒性。论文首先介绍本课题的研究背景、意义、常见应用,详
氮化物荧光粉具有优异的发光性能,可以有效解决现有白光LED红光部分光强不足的问题从而提高器件的显色指数,在半导体照明领域得到了广泛关注和研究。传统高温固相法合成氮化物荧光粉,需要价格高昂的氮化物原料和复杂的无水、无氧操作流程以及高温、高压合成条件。碳热还原氮化法以低成本的氧化物为原料,可以在大气环境中操作且合成温度相对较低,在制备合成氮化物荧光粉领域具有潜在的应用价值。为保证氧化物原料被充分还原,
随着能源和环境危机的加剧,汽车轻量化已经成为汽车行业发展的主要趋势之一,高强铝合金代替钢已经成为实现汽车轻量化的途径之一,然而铁与铝较大的物理性质差异,以及铁与铝之
近年来,来自出行、安全和环境方面的交通问题使得车联网技术成为了国内外研究的重点课题,蜂窝车联网(Cellular Vehicle-to-Everything,C-V2X)作为具有潜力的车载通信技术也因此成为了研究的热点。车辆对车辆(Vehicle-to-Vehicle,V2V)通信作为C-V2X的重要通信类型之一,是提高交通效率和减少交通事故的关键技术。本文对基于设备间通信(Device-to-D
现有的大多复合材料在使用寿命到达之后,不易于回收,不能自然降解,会对环境造成污染,自然资源保护、回收再利用的问题引起了人们对天然纤维增强复合材料的新兴趣。通常使用可生物降解的纤维作为增强体,可生物降解的聚合物作为基体。蚕丝是天然蛋白质纤维比其他天然纤维更加轻柔,不仅具有良好的断裂伸长度和较好的断裂强度及模量,并且具有较好的生物相容性和生物可降解性。聚乳酸(PLA)是具有良好的热塑性和生物可降解性能
在实际的工程系统中,输出约束和未建模动态是影响系统动态性能的重要因素,同时为了达到特定的性能指标,优化也是追求的目标之一.如果系统在实际背景下的输出约束得不到满足,那么系统的动态性能会受到影响,甚至是导致系统不稳定.由于建模误差和不可测量性,系统的未建模动态也严重影响系统的稳定性.同时实际系统可能会有优化的需求,以达到特定的性能指标.目前,关于输出约束和未建模动态非线性系统的研究已经取得了一些成果
基于AlSiTiNi粉末的成分设计,在直接激光熔覆和高频微振辅助激光熔覆条件下制备双模态铝基复合涂层。探索了直接激光熔覆涂层、添加WC粉末强化相制备激光熔覆涂层和高频微振
现代化战争的发展趋势是信息化和智能化。作为现代战争的重要装备,雷达的作用已经不只是提供目标的空间位置,而是需要通过回波信号获取目标更加详尽的信息。雷达自动目标识别技术可以获取目标的属性、类别甚至型号等信息,因此受到了各国的广泛关注。高分辨距离像(HRRP)包含了目标大小和散射体分布等结构信息,且容易获取和处理,因此被广泛应用于雷达自动目标识别领域。目标的高分辨距离像会因其外形的变化而发生改变。在战
冲击地压是煤矿安全生产领域面临的主要灾害之一,冲击地压强度随着煤矿开采深度及强度的加大而增加,严重危害着矿井安全生产和有效开发,对矿井工作人员的人身及财产安全构成
长期以来,义务教育对整个社会经济的发展起着至关重要的作用,因此,各国都非常重视义务教育供给的问题。义务教育一方面它具有消费上的非竞争性,另一方面它具有受益的非排他性