基于深度学习注意力机制的Hashtag推荐算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:bamboo007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在真实世界的社交网络中,例如Facebook,Instagram,Twitter等,用户会自发地为自己产生的内容(例如文本推特,用户的个人照片)添加上一些Hashtag,这种为自己产生的内容添加Hashtag的行为是一种社交行为,具有任意和自发的性质。Hashtag在社交网络中很常见,它的用处也很多,例如用于分类任务,话题模型,情感分析,信息检索等。在研究上,大多数的研究者集中在对文本推特推荐Hashtag,在对社交网络中图片的Hashtag推荐的研究比较少。但是,像Instagram,Flickr等等这样的网络,用户倾向于分享更多的图片,社交网络中存在着大量的图片内容,图片里面包含着丰富的语义信息,这些信息也可以被应用到推荐任务上。自动给图片推荐Hashtag是一项非常有挑战性的任务,因为Hashtag和用户的偏好相关,有些Hashtag甚至跟图片的内容不怎么相关,因此,Hashtag和图片的关系可以看成是一种弱相关关系,多数Hashtag推荐相关的工作主要集中在社交网络中文本内容的Hashtag推荐,这里把Hashtag推荐任务拓展到图片,并且对Hashtag之间这种相关的关系进行建模,提出了一个新的算法,叫做基于注意力机制的图片Hashtag推荐算法(Attention-based Neural Image Hashtagging Network,A-NIH),ANIH模型分为编码器和解码器两部分,编码器通过序列注意力来选取重要的特征,过滤掉图片中的噪声,从而获得了更好的特征表示;解码器通过循环神经网络利用贪心搜索的方式来生成推荐序列,能够克服序列模型的重复标签的生成,又能够对标签关系建模。这样模型就把推荐问题看作是一个序列生成的问题,并且在真实世界数据集上做了一系列的实验,取得了不错的效果。其中,在HARRISON数据集上,跟VGG算法相比,基于Resnet 50的A-NIH模型在Precision@1上提升了2.34%,在Recall@5上提升了3.56%,在Accuracy@5上提升了8.4%。为了验证模型在大数据集的情况下的有效性,检测模型在相似任务上的迁移能力,模型在NUS-WIDE数据集上做了实验,其中基于Inception V3的A-NIH模型在Precision@1上提升了1.73%,在Recall@5上提升了1.92%,在Accuracy@5上提升了3.64%。社交网络里面的短文本也非常的多,大部分情况下,文本含有的信息对Hashtag推荐也非常的有帮助,因此,在考虑到了图片和文本的及其结合的情况下,提出了针对该场景的一个新的深度学习算法框架结构,叫做基于多模态注意力机制的Hashtag推荐算法(MultiModal Attention-based Neural Network Model,MMAN)模型,MMAN模型分为编码器解码器两部分,编码器在A-NIH的图片编码器的基础上,融入了文本特征编码器,利用双向循环神经网络来最文本序列进行建模,既能前向上下文信息,又能考虑到后向上文的信息,利用注意力机制选取重要的特征;解码器利用编码器的特征对Hashtag进行解码,在A-NIH的解码器的基础上融入了文本的特征进行解码,考虑到了文本与Hashtag之间的关系。最后,MMAN在自己制作的Custom Instagram数据集的实验显示,和Co-Attention算法相比,MMAN(Resnet50)模型在Precision@1上提升了13.15%,在Recall@5上提升了8.2%,在Accuracy@5上提升了27.99%,最终取得了不错的提升效果。
其他文献
1957年10月出生,工程技术应用研究员,国家一级注册建筑师、国家注册城市规划师,先后有6项设计作品获国家级、省级一、二等奖。2002年被评为山东省优秀建筑师;1993年被国务院授予
近些年,由于人类对化石能源大规模不合理使用,导致这类能源受到极大破坏及浪费,而且这类能源对环境的污染也较为严重。因此,探索开发可再生绿色能源来代替传统化石能源是人类
对火灾后某多层框架进行了现场检测,通过外表观测对构件进行了初步鉴定评级。利用取芯法、回弹综合法、超声波平测法,对火灾最高温度进行了分析,对火灾后混凝土损伤深度进行
住宅工程的质量通病诸如墙面渗漏、结构件开裂及粉刷起壳等时有发生.其原因多数是由于施工不当或疏于管理造成的.提出了根本防治住宅工程中的质量通病应采取相应的技术措施.
1前言屋面工程是房屋建筑的一项重要分部工程,常规防水屋面由卷材防水屋面和非卷材防水屋面之分,在此基础上再分保温和非保温屋面.按屋面性质分类,由以下几种屋面面层:1.卷材
叙述了地面辐射采暖的结构、特点、应用技术、适用的材料、配套事宜及其发展前景.
为进一步让中国的指南制定者、临床医生、卫生政策制定者以及相关研究人员深入了解和恰当使用世界卫生组织(World Health Organization,WHO)指南,GRADE中国中心联合WHO指南评审
某居民楼原为八层钢筋混凝土框架结构,后加建两层.由于未采取相应技术措施,造成部分框架和墙体开裂.根据房屋裂缝的形状、走向、位置等损坏情况,做出鉴定结论,提出维修加固建
《生活日报》报道,济南一家刚开业的药店由于药品售价比一般药店的平均售价还要低30%左右,因此很快得到市民的青睐.然而,个别同行却以他们违反了“游戏规则”为由,找店主闹事
期刊
采用结构力学理论与方法,对结构焊接变形进行了有限元数值模拟.将焊缝等效为残余应力与残余应变,其中,将T形接头视为板条梁,采用热弹塑性有限元分析方法分析了焊后残余应力分布特