论文部分内容阅读
近年来,随着互联网技术的飞速发展,社交媒体、在线购物网站等越来越受到人们的欢迎,人们可以从这些丰富的网络应用中寻找各自感兴趣的内容或需要的物品。以用户为中心的网络数据包罗万象,除了数量巨大,形式也是多种多样,有文本、图像、视频、关系、行为等等,如何从如此纷繁复杂的信息中挖掘出有价值的信息是个重要的挑战。利用这些信息,对用户的兴趣、行为进行理解,对用户生成的信息进行分析,进行用户建模的研究,构建用户全方位的表达,有着重要而实际的意义,可以在个性化推荐、在线广告、异常信息检测等方面产生推动性的成果。目前,深度表达学习的研究在图像、语音等多个领域带来了巨大的提升,以此方法进行用户建模,构建用户表达,是一个十分有效而具前景的方法。本论文旨在基于深度表达学习方法,对用户建模中的几个关键性问题进行针对性的研究,提出对应的解决和改进方案,具体研究如下: (1)用户在网络上的行为有着丰富的上下文信息,包括时间、地点、天气等情境信息。在不同的情境下,用户有着不同的行为模式。学习用户在不同上下文下的表达,有着很强的应用价值,可以有效实现用户行为的预测,应用在个性化推荐、点击预测等场景。传统的基于因子分解的上下文建模方法,关注的是实体间的相关性和相似度,难以挖掘实体间的深层联系,无法建模实体间的状态变换作用。因此,提出了上下文信息对用户和目标物品所具有的操作特性,并用张量乘法的形式进行建模。随后,将模型进一步一般化,扩展到更复杂的多实体交互场景,并用递归结构进行建模。我们的方法在上下文感知推荐、点击预测等应用中取得了优于之前方法的效果。 (2)用户行为具有很强的时序依赖性,即之前的行为信息对之后的行为有着很大的影响,这种特性对于个性化建模有着重要作用。传统的基于马尔可夫链的行为预测方法,由于其强独立性和无法建模行为间隐含关系的缺点,逐渐被循环神经网络取代。相比于循环神经网络传统应用的文本、视频等数据,用户行为数据包含更复杂的信息而难以被模型直接建模,如外部情境、时间差、局部行为模式、多行为信息等。因此,针对这些信息,对循环神经网络的结构进行了适配与优化。我们的方法在多个用户行为预测的数据集上都取得了当下最优的效果。 (3)伴随着用户的行为,还有大量的多模态内容信息,如商品的图像信息。在用户购买衣服、装饰等商品时,这些图像信息往往起到了很关键的作用,为基于视觉的个性化推荐提出了需求。针对于这个问题,提出了一种风格感知的神经网络,可以建模商品的风格属性,把握用户的兴趣偏好。在真实数据上对我们的方法进行了实验和可视化聚类,可有效地把握商品和用户的风格特性,取得了优于之前方法的效果。 (4)在网络应用中,除了上述用户正常的使用行为,还往往存在一些异常的行为,如不实信息的发布与传播。这些不实信息的传播对互联网和社会的健康发展有着很大的危害,如何实现事件真假的自动快速的检测,是一个十分重要的问题。网上与一个事件相关的信息往往有很多条,而其中只有很小的一部分对检测能起到很重要的作用,这些有用的信息很容易被大量的无用信息淹没掉。因此,提出了一种基于注意力机制的不实信息检测方法,根据文本内容和动态时间两方面信息,自动抽取对检测起到重要作用的信息,提升检测效果。我们的方法在多个社交媒体数据集上都取得了当下最优的效果。