应用LDA主题模型的Web API分类研究

来源 :第六届中国计算机学会服务计算学术会议 | 被引量 : 0次 | 上传用户:liufuru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web API是Web应用程序接口的简称,通常使用半结构化的HTML语言来描述.Web API作为轻量级的Web服务,因为其简单、轻便和容易调用等特点,而受到广泛欢迎.随着互联网上发布的Web API数量的迅速增长,Web API的发现成为了一项具有挑战性的工作.对Web API进行高效、准确的分类,可以为Web API的发现提供有效的帮助.然而,由于Web API数量的庞大,对它们的分类是一项工作量相当大的任务.因此考虑了Web API的名称、描述、标签等信息,使用LDA(Latent Dirichlet Allocation)主题模型对Web API文本进行建模,得到Web API文本的主题分布,然后运用自动分类方法,对Web API进行分类.在1197个Web API文档集合上进行15个类别的分类实验表明,基于LDA主题模型的Web API分类算法比传统的基于向量空间模型的分类方法效果更好.
其他文献
集群文件系统作为一种典型的分布式文件系统类型,通过集群内多个节点的协同,消除了单点故障以及性能瓶颈问题,实现了高可用、高性能以及动态负载均衡,并且具有较高的可扩展性,因此常作为实现和提供云存储服务的关键技术之一.文章针对HDFS集群部署主要局限于同一数据中心内部的问题,提出一种跨集群的文件资源调度机制,支持多个HDFS集群动态组网,实现集群的协同工作;同时通过引入文件资源池,屏蔽了不同集群之间的差
随着GPS设备(如智能手机、GPS导航仪、GPS记录仪等)的广泛应用,其产生的位置信息也越来越多,基于位置的社交网络(location-based social networks,LBSNs)推荐系统受到了更多的关注.旅游行程推荐是LBSNs中非常热门的研究课题之一,但是大多数现有文章主要是研究向单个用户推荐旅游行程.在本文中,研究向用户群体推荐旅游行程.首先,根据用户的签到记录,使用K-mean
支持广域室内位置信息获取是室内外一体化位置服务的基础.基于A-GPS、蜂窝站定位和Wi-Fi指纹定位,并融合智能手机的内置传感器,提出多精度位置传感网构建方法,设计以位置服务网关为核心的可扩展定位场描述模型,定义室内定位位置服务基本接口,形成了满足全息位置地图室内定位需求的位置感知与服务框架.在试验环境下,构建的室内定位与服务系统可以根据不同的感知参数集提供从亚米级到米级的定位精度.
信息-物理融合系统(Cyber-Physical System,CPS)是一个综合计算、网络和物理环境的多维复杂系统.CPS的意义在于将物理设备连接到互联网上,让物理设备具有计算、通信、精确控制、远程协调和自治等五大功能。由于CPS天然的异构、分布式特点,利用面向服务的架构(SOA)的原则指导CPS的建设已经成为一种典型的技术路线.然而,目前大多数方法过度抽象了CPS中时空相关要素,忽视CPS所特
文本作为语言的视觉形式,是人类最重要的交流工具,基于文本的信息隐藏算法具有很高的实用价值.文本的一个明显特点是高度凝练,信息冗余少,因而文本隐藏的容量较低.另一方面,传统的文本隐藏建立在修改载体的基础上,而文本语义对于修改非常敏感,微小的修改可能引起明显异常,因而文本隐藏的隐蔽性较差.针对以上问题,深入分析了网络文本大数据的特点,据此设计了一种基于网络文本大数据的信息隐藏算法,把对载体的修改转化成
针对物联网环境下以服务为资源的竞争问题,从资源调度的角度进行了研究与建模分析.利用资源调度机制和回馈机制建立了服务调度模型,提出了基于回馈的服务等待队列,提高服务选择准确率.运用排队论相关知识对本模型进行了时延特性分析.实验结果表明,本文的方法能够服务资源有限的情况下降低服务请求的时延,保证服务请求的相对公平,同时很好的满足用户的个性化需求.
随着互联网上服务数量的剧增以及类型的多样化,如何准确、高效地发现满足用户需求的服务成为一个巨大挑战,服务聚类是提高服务发现效率的重要技术,但是现有的服务聚类方法很少从服务需求的语义出发.文中提出了一种基于需求功能语义的服务聚类方法:首先,从需求语义角度出发,利用服务描述文本,采用自然语言处理的方法提取服务功能信息集;然后,基于服务功能信息集,进行服务相似度计算;最后,通过K-means算法实现服务
基于数据服务的情景数据集成利用数据服务封装互联网上的数据源,用户根据即时、个性化的需求组合数据服务集成不同数据源中的数据.数据源服务化后,不同数据源之间的数据关联需要通过服务之间的关联实现.由于没有承载数据服务之间数据关联的载体,已发现和建立的关联无法得到复用,用户每次集成都需要手工选择和组合服务,导致组合过程繁琐、易出错,集成的效率低.提出一种面向数据服务之间数据关联的服务超链模型,通过一个服务
由于源自传感设备的传感流数据在重用和共享时面临安全性、私密性、实时性和持续性等多方面的挑战,传统的"请求-响应"式的数据服务无法满足用户获取流数据的需求.本文提出了一种面向传感流数据的服务化建模方法以使用户能够按需、持续、实时的获取流数据,主要贡献包括:提出一种流数据服务模型及相应服务建模操作,帮助数据提供者方便的将传感流数据封装并发布为流数据服务;提出了一种事件驱动的流数据服务实现方法,并基于云
互联网环境中的软件系统开发已逐步过渡到"用户主导,按需服务"的软件规模化定制方式,以服务互操作和服务聚合来进行按需服务的开发模式日益成为新的发展方向.然而用户需求多变、业务过程日益复杂往往导致服务发现效率偏低.传统服务发现机制往往关注服务本身的内在属性,缺乏对用户需求信息的描述,因而无法全面衡量服务资源与用户需求之间的相似度,势必影响到用户对所需求服务的满意度.因此将基于RGPS领域资产(Role