文本表示方法对微博Hashtag推荐影响研究——以Twitter上H7N9微博为例

来源 :图书与情报 | 被引量 : 0次 | 上传用户:hujialian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在总结国内外Hashtag推荐方法和短文本表示方法的基础上,文章利用基于K最近邻(KNN)的Hashtag推荐方法,将微博文本表示为向量然后计算相似度,从语料中选出与目标微博最相似的微博文本,然后抽取候选Hashtag。文章比较了向量空间模型(VSM)、潜在语义分析模型(LSA)、隐含狄利克雷分布模型(LDA)、深度学习(DL)等四种文本表示方法对基于KNN的Hashtag推荐效果的影响。以Twitter上H7N9微博为测试数据,实验结果表明深度学习的文本表示方法在基于KNN的Hashtag推荐中取得最好
其他文献
摘 要:作为开放关联数据云图中重要的数据集合,政府开放关联数据集拥有庞大的数据规模和发达的数据共享实践,受到广泛关注。文章对曼海姆关联数据目录中的284个政府类开放关联数据集进行调查,从数据集的发布国家分布、主题分布、数据集格式、链出情况、链入情况、连接谓词、词表和开放协议等方面进行统计分析,发现政府类开放关联数据集具有数据集国家分布较集中、数据集主体涵盖政府工作各个方面、数据集之间关联关系紧密、
目的 :探讨乳腺浸润性导管癌的超声图特征与肿瘤组织学分级、激素受体状态的相关性以及年龄因素的影响。方法:回顾分析99例乳腺浸润性导管癌患者的术前超声影像,包括后回声特征