论文部分内容阅读
随着社交网络的发展,用户兴趣的挖掘方法在商业推广、社会科学、网络空间治理等领域的研究价值越来越重要。为了更为全面和准确的研究用户兴趣的内在因素和外在表现,本文结合社交网络的特点,从个体和群体两个角度分析用户兴趣的特征,重点研究了通过文本内容、社交关系、静态社区以及动态交互挖掘用户兴趣的方法。论文的主要贡献如下:1.针对短文本、话题分散等问题,提出基于文本内容的兴趣关键词提取算法,并根据外部知识库以及新闻网站建立分级的兴趣体系,通过关键词映射对用户个体兴趣进行挖掘和语义理解;同时,提出了一种半监督的SVM改进算法,在少量的人工标注数据上能够识别和过滤大量的文本噪声。2.提出了一种在大规模异构网络中基于社交关系发现用户兴趣的方法。分析了社交网络节点分化的发展特点,区别对待大V、明星等超级节点以及普通用户,通过引入标签传播算法,计算兴趣话题在普通用户之间的传播,在异构网络中快速构建较为全面的用户兴趣图谱。3.提出了结合用户属性相似度和关系连接的方法识别用户静态群体,并用有监督学习算法推理群体兴趣特征。重点选取用户关键词、网络结构等属性计算用户相似度,再把相似度映射到用户之间的连接上用边聚类方法划分可能存在重叠的多个社区,最后根据部分标注的用户兴趣挖掘所属群体的共同兴趣。4.提出了用博弈论对用户行为策略建模的方法识别动态交互群体,通过映射交互话题到层次兴趣体系挖掘群体的兴趣。对用户在策略博弈过程中的动机问题进行建模,从兴趣的角度定义了用户个体的效用函数,并采用局部均衡代替全局均衡,用博弈方法识别与话题相关的动态群体,同时根据话题确定群体的兴趣。最后,本文设计了社交网络用户兴趣挖掘系统,包括对个体用户兴趣特征的建模与描述,以及对特定群体兴趣、行为的监测和追踪等功能。该系统的部分功能已投入使用,实现了在真实的网络环境下对特定用户以及大规模用户群体的兴趣等行为特征的分析和预测,为一些国家部门在互联网舆情感知、热点事件分析与预警等管理工作中提供了技术支撑。