论文部分内容阅读
随着大数据时代的到来,互联网上的信息正以指数级速率增长,面对网上的海量信息,人们越来越难以快速地为自己有限的需求找到有用的信息,摆脱垃圾信息的困扰。双结构网络主张在互联网主结构的基础上增加基于“辐射·复制”模型的播存次结构网络,以物理变革和二元结构的创新思路对当前互联网主结构实施“深度去冗”,并在用户终端提供鲜明的个性化服务,以帮助用户快速选取有用信息。然而传统推荐算法对用户交互行为的依赖过重,推荐精度取决于用户评分、物品特征等因素,受冷启动问题影响较大。基于本体的语义推荐算法受冷启动问题影响小,但推荐实时性差。而双结构网络中每天产生的新信息数以万计,对实时性要求较高。如何在最大程度上降低对用户交互行为的依赖和冷启动问题的影响,并快速地产生准确的推荐信息是双结构网络中的推荐机制面临的一个难题。针对传统推荐算法过于依赖用户交互行为,以及推荐实时性难以满足双结构网络特定需求的难题,本文利用命名实体(NamedEntity,NE)表示信息的语义内涵,设计了一种动态语义关联实体库DSAEL(Dynamic Semantic Associative Entity Library)及其实体链接方法 DSAEL-EL(Entity Linking Based on Dynamic Semantic Associative Entity Library)。并在 DSAEL-EL 算法的基础上,根据双结构网络的特点提出了一种结合实体语义和用户兴趣实体标签的混合信息推荐算法HRESIL(Hybrid Recommendation Algorithm Combining Entity Semantics and Entity Interest Labels),以帮助用户产生实时推荐信息。本文的主要研究工作如下:1)针对传统实体链接方法难以适用于双结构网络的问题,设计了一种基于DSAEL的实体链接方法DSAEL-EL。首先利用维基百科和百度百科离线语料构建DSAEL基础库,接着识别信息中的实体、计算它们的语义权重,然后通过计算候选实体的关联实体集与信息的待消歧实体集的相似性确定目标实体,最后利用目标实体集合对DSAEL进行更新。DSAEL-EL算法根据信息的实体语义相似性进行消歧,能自适应上下文的变化而产生更加合理的链接结果。2)针对传统推荐算法过于依赖用户交互行为以及推荐实时性差的问题,设计了一种结合实体语义和用户兴趣实体标签的混合信息推荐算法HRESIL。在广播源点利用DSAEL-EL算法得到信息的目标实体集合并完成DSAEL母库的更新,接着对目标实体集合进行UCL(Uniform Content Label)标引并分发到边缘服务器和用户终端。边缘服务器利用接收到的UCL对DSAEL子库进行更新,并与用户终端交互以响应用户的个性化请求。相比于传统推荐算法,该算法不依赖于用户交互行为,并通过DSAEL的节点关联产生推荐信息列表,满足双结构网络的特定需求。3)在双结构网络原型系统的基础上,设计并实现了基于上述算法的双结构网络新闻信息推荐系统,并通过相关实验对DSAEL-EL和HRESIL算法的性能进行了验证。实验结果表明,相比于传统的实体链接算法,DSAEL-EL算法实体链接准确性更高;相比于传统的推荐算法,HRESIL算法受冷启动问题影响更小,实时性更好。