基于深度表达学习的用户建模研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:sws1274
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的飞速发展,社交媒体、在线购物网站等越来越受到人们的欢迎,人们可以从这些丰富的网络应用中寻找各自感兴趣的内容或需要的物品。以用户为中心的网络数据包罗万象,除了数量巨大,形式也是多种多样,有文本、图像、视频、关系、行为等等,如何从如此纷繁复杂的信息中挖掘出有价值的信息是个重要的挑战。利用这些信息,对用户的兴趣、行为进行理解,对用户生成的信息进行分析,进行用户建模的研究,构建用户全方位的表达,有着重要而实际的意义,可以在个性化推荐、在线广告、异常信息检测等方面产生推动性的成果。目前,深度表达学习的研究在图像、语音等多个领域带来了巨大的提升,以此方法进行用户建模,构建用户表达,是一个十分有效而具前景的方法。本论文旨在基于深度表达学习方法,对用户建模中的几个关键性问题进行针对性的研究,提出对应的解决和改进方案,具体研究如下:  (1)用户在网络上的行为有着丰富的上下文信息,包括时间、地点、天气等情境信息。在不同的情境下,用户有着不同的行为模式。学习用户在不同上下文下的表达,有着很强的应用价值,可以有效实现用户行为的预测,应用在个性化推荐、点击预测等场景。传统的基于因子分解的上下文建模方法,关注的是实体间的相关性和相似度,难以挖掘实体间的深层联系,无法建模实体间的状态变换作用。因此,提出了上下文信息对用户和目标物品所具有的操作特性,并用张量乘法的形式进行建模。随后,将模型进一步一般化,扩展到更复杂的多实体交互场景,并用递归结构进行建模。我们的方法在上下文感知推荐、点击预测等应用中取得了优于之前方法的效果。  (2)用户行为具有很强的时序依赖性,即之前的行为信息对之后的行为有着很大的影响,这种特性对于个性化建模有着重要作用。传统的基于马尔可夫链的行为预测方法,由于其强独立性和无法建模行为间隐含关系的缺点,逐渐被循环神经网络取代。相比于循环神经网络传统应用的文本、视频等数据,用户行为数据包含更复杂的信息而难以被模型直接建模,如外部情境、时间差、局部行为模式、多行为信息等。因此,针对这些信息,对循环神经网络的结构进行了适配与优化。我们的方法在多个用户行为预测的数据集上都取得了当下最优的效果。  (3)伴随着用户的行为,还有大量的多模态内容信息,如商品的图像信息。在用户购买衣服、装饰等商品时,这些图像信息往往起到了很关键的作用,为基于视觉的个性化推荐提出了需求。针对于这个问题,提出了一种风格感知的神经网络,可以建模商品的风格属性,把握用户的兴趣偏好。在真实数据上对我们的方法进行了实验和可视化聚类,可有效地把握商品和用户的风格特性,取得了优于之前方法的效果。  (4)在网络应用中,除了上述用户正常的使用行为,还往往存在一些异常的行为,如不实信息的发布与传播。这些不实信息的传播对互联网和社会的健康发展有着很大的危害,如何实现事件真假的自动快速的检测,是一个十分重要的问题。网上与一个事件相关的信息往往有很多条,而其中只有很小的一部分对检测能起到很重要的作用,这些有用的信息很容易被大量的无用信息淹没掉。因此,提出了一种基于注意力机制的不实信息检测方法,根据文本内容和动态时间两方面信息,自动抽取对检测起到重要作用的信息,提升检测效果。我们的方法在多个社交媒体数据集上都取得了当下最优的效果。
其他文献
炼钢生产是钢铁生产过程的关键环节,也是现代钢铁企业的核心工序,直接影响着钢铁生产成本和经济效益。如何实现炼钢调度计划的优化编制,达到降低生产成本、减少损失、平衡物流、
近年来,智能仿生腿是机器人学、生物医学工程学和康复工程学领域一个备受关注的研究课题。由于战争、疾病、工伤、交通事故及自然灾害等原因,致使数以百万的人失去下肢,人们
双足机器人是一种可模拟人类双腿行走的高级智能机器人,具有代替人类在危险环境下进行重复工作的潜力。但对于非正常行走,如残障人士的步行运动,则不能完全模拟。智能假肢研
我国赤铁矿品位普遍较低,选别难度大,无法直接采用常规的磁选方法获得合格的精铁矿。赤铁矿选矿工业中,需首先将其在竖炉中进行高温还原磁化焙烧,将弱磁性矿物变成强磁性矿物
遥感图像变化检测技术在国土资源规划管理、自然灾害监测、军事目标打击效果评估等军民领域都具有重要的应用价值。通过高分辨率遥感图像可以检测到更加详细的变化信息,因此高
学位
我国蕴藏着大量的低品位有色金属资源,随着国民经济的快速增长,我国工业化进程的不断推进,如何经济有效地利用这类矿产资源,对我国的可持续发展战略具有极其重要的意义。作为
压电式微力传感器的低能耗、高灵敏度、易于与压电微执行器集成等优点使其具有良好的应用前景。压电式微力传感器的研究尚处于起步阶段,本文以基于PVDF薄膜的微力传感器为研
通用模型控制(CMC)是在一般模型控制(GMC)基础上,直接利用非线性过程,将非线性模型直接嵌入控制器中,在控制量不受约束的情况下,将非线性系统变为一个标准二阶线性系统。为了克服
智能车作为移动机器人的一种,是一个集环境感知、规划决策、自动驾驶等多种功能于一体的综合系统。为了提高智能车跟踪和运动性能,本文在分析智能车系统原理的基础上,从硬件
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。自动人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计