基于概率主题模型的标签预测

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hwen1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
充分利用用户自定义标签信息,是理解Web资源语义,提高Web应用智能程度的重要途径。针对资源标签分派中大量存在的信息不完整、不一致的现象,建立基于用户标记行为特征的概率主题模型,利用概率主题模型实现对标记信息不完整资源的标签预测。根据每个资源所对应的标签的统计特征,可产生不同形式的标签文档,通过分析标签文档所生成主题的性能,确定适合于特定数据集的标签文档形式;利用同一主题内词汇间的高度相关性,设计合理的预测标签排序方法,从而实现对标记信息不完整资源的标签预测以及标签语义不一致现象的检测。在数据集Delic
其他文献
基于差分盒子维数提出了一种针对空间目标的图像分割算法。首先根据空间环境目标自然背景与空间目标人造结构的特点差异,从分形理论的相似性上对星空背景进行分析,利用像素邻域灰度方法得到目标和背景的边界。其次,在对给定阈值及该阈值下图像的差分盒维数关系进行分析的基础上,提出基于灰度方差的阈值选择方法。最后给出空间目标图像分割算法的流程,通过诸多仿真空间图像处理验证该分割算法是有效的。
传统刀具补偿方法的计算过程复杂繁琐,计算量相对较大。提出一种新的矢量法刀具半径补偿,通过分析加工线段转接点处切线矢量夹角在平面坐标系中的分布情况,判断出不同的转接
访问控制技术是保证Web服务组合增值应用安全性和可靠性的关键技术。主要论述了组合Web服务访问控制技术的研究现状及其问题。首先论述了组合Web服务安全面临的挑战;接着基于
网络图像语义自动标注是实现对互联网中海量图像管理和检索的有效途径,而自动有效地挖掘图像语义是实现自动语义标注的关键。网络图像的语义蕴含于图像自身,但更多的在于对图像语义起不同作用的各种描述文本,而且随着图像和描述知识的变化,描述文本所描述的图像语义也随之变化。提出了一种基于领域本体和不同描述文本语义权重的自适应学习的语义自动标注方法,该方法从图像的文本特征出发考查它们对图像语义的影响,先通过本体进
针对面向服务的领域需求表达与规约化组织,提出一种扩展的服务特征概念与服务特征模型,以及基于OWL本体描述语言的服务特征本体元模型。扩展的服务特征概念可更为完整地表征
现有群密钥管理方案大都基于GDH(Group key Management Based on Diffie-Hellman)密钥交互协议,该协议限制了子树规模。针对这一问题,提出一种基于双线性对的群密钥管理方案(BPG
在随机路由的基础上,给出一种针对窃听问题的马尔可夫博弈路由模型(Markov Game Theory-based Rou-ting,MGBR)。给出的模型以发送者和窃听者为马尔可夫博弈双方,发送者通过概率
为提高分类模型的稳定性,提出基于决策树分类器集成方案用以识别流量。模型首先利用特征选择方法(FCBF)提取最优分类特征信息,按Bagging随机抽样原理形成5个子分类器,依少数服
分布式数据交换网络系统中,海量数据传输一直是数据交换的难题。在进行路由选择时通常考虑跳数和时延,不提供QoS保证,致使数据在传输过程中因阻塞或中断长时间延时、严重的长
为了解决现有语义Web服务发现方法查询效率不高的问题,提出了一种基于点击率索引的Web服务发现方法。通过为统一描述、发现和集成注册库中点击率较高的Web服务建立索引,使得