一种基于用户兴趣的微博实体链接方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:peterqiu123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博内容较短、歧义较大的问题,利用概率主题模型对用户的兴趣进行建模,提出了一种基于用户兴趣的微博实体链接方法。具体地,利用现有的主题模型从知识库的大量数据中训练实体与上下文词汇的语义关联,提出用户兴趣主题模型来建模用户对实体的兴趣以及微博的语义,并完成实体链接的任务。此外,在真实数据集上进行了大量实验和分析,取得了87.6%的实体链接准确率,实验结果表明,与现有方法相比,该方法通过用户兴趣的建模更好地刻画了微博的语义,因而也取得了更高的实体链接准确率。
其他文献
面向方面的规范描述在软件体系结构建模和分析中起着重要的作用,但目前已有的方法不能对体系结构方面及其编织逻辑的详细描述提供足够的支持,也缺乏行之有效的方法对方面的编织
针对软件可靠性模型中对故障检测率行为描述的不足,考虑软件固有的故障检测率是一个随时间增加的减函数,以及测试人员的学习能力是一个随时间增加呈S型的增函数,两者共同决定
在软件缺陷预测研究中,若考虑了大量度量元会造成数据集中含有大量特征,其中冗余特征和无关特征会降低缺陷预测模型的性能。提出一种两阶段混合特征选择方法 HFS,具体来说,首
随着无线传感器网络的快速发展,对外部用户的身份进行确认已成为获取传感器网络中实时数据所要解决的关键问题。在对无线传感器网络中双因素用户认证密钥协商方案系统的研究
针对基本萤火虫算法存在早熟现象,提出了一种变尺度混沌光强吸收系数调整策略的混沌萤火虫优化算法。首先,应用Sinusoidal映射产生混沌变量来描述光强吸收系数;其次,在算法迭代过程中引入变尺度混沌扰动,使光强吸收系数与迭代次数呈线性变化;最后,将萤火虫群分成三个子种群协作合作,可有利于增强算法搜索前期的全局探索能力和搜索后期的局部细化搜索能力。通过标准测试函数测试,实验结果表明算法是有效的,比基本
针对移动数据库中的同步复制问题,将多agent技术和事务结果集引入到事务级同步复制中,提出了基于多agent的移动数据库事务级同步复制模型。该模型与现有模型相比,具有如下主要特点:a)提高了系统可扩充性;b)减少了移动设备及网络资源占用;c)设计了一系列针对恶劣网络环境的同步策略。实验结果验证了模型的优良性能和恶劣环境下的可用性。
针对智慧家居控制系统中基于Android系统轻型网关的敏感数据泄露问题,提出了一种基于Android本地库层污点传播和应用层控制的分层互连检测模型。通过在IPCBinder通信时标记污
为衡量风险态度对复杂供应链系统的影响,建立了更贴近现实,具有信息系统支持的供应链动态系统模型。刻画了供应链系统的库存量订货量相图,分析不同缺货策略下,受到决策者风险态度
针对传统算法中有关时间序列流不协调子序列计算代价比较高的问题,提出了一种快速发现Top-K不协调子序列的算法。该算法通过特殊的数据结构保留计算结果,避免了大量的重复计算,从而达到降低时间复杂度的目的;同时也通过一定的保留策略只保留有用的计算结果并及时清理无用的计算结果,从而达到降低空间复杂度的目的。实验采用随机数据和真实数据进行算法测试,其结果表明,该算法能显著降低计算量从而实现快速发现Top-K
针对影响台风最大风速的输入变量较多以及输入变量与输出变量之间的非线性变化特点,首先计算各个输入变量与输出变量间的互信息,这些互信息间接地反映了各个输入变量与输出变量间的相关性;然后根据t检验法确定一个阈值,对于互信息小于阈值的输入变量作不相关变量处理,筛选出最佳的模型输入变量;最后采用高斯过程回归模型对筛选后的样本集进行拟合,在贝叶斯非参数建模的框架下,确定高斯过程回归模型的协方差函数。仿真结果表