基于文本挖掘的社交网络用户画像建模与应用

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:catmaster
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展使得人们日常生活产生了翻天地覆的变化,随着智能手机的普及,网络环境的不断完善,如今已经全面进入移动互联网时代。无论是通信运营商,还是网络应用提供商,都认识到了用户的重要性。如何更好的了解用户,提升用户体验成为了互联网服务的最重要的课题。海量的网络用户数据为我们更好的了解用户提供了丰富的素材,如何利用这些数据在如今成为了研究者的热点,网络用户画像就是其中之一。现有的社交网络用户画像研究关注的特征维度很多集中于用户基本信息作为特征,而这些基本信息一般需要通过特定的API来获取,越来越多的社交媒体平台开始保护用户的隐私使得这些信息越来越难于获取。而由于社交网络平台具有丰富的用户生成内容,这些内容容易获取,本文主要研究了用户的文本内容。本文将用户的人格维度引入到了用户画像中来,研究了与分析了主题特征与用户人格之间的相关性,并建立了基于主题模型为特征的社交网络用户人格预测模型。目前的研究并没有将人格因素与主题相结合的概率模型,本文在主题与用户人格具有相关性结论的基础上,提出了用户人格主题的概率生成模型及其改进模型,并在真实数据集上进行实验。用户人格主题模型能够同时生成用户的主题-词分布以及人格-词分布,从而可以直接观测出人格与词的对应关系。
其他文献
随着人口老龄化成为全球日益严重的医学和社会问题,与衰老相关的神经退行性疾病已经成为人类面临的最大公共健康挑战之一。这类疾病共同的致病特征之一就是异常聚集蛋白的出
鸡心脏采血技术是对动物进行采样监测的前提性工作,分为雏鸡心脏采血技术和成年鸡心脏采血技术,其中成年鸡心脏采血技术又可分为侧卧进针采血法、仰卧保定采血法。本文介绍了
蚜虫是世界上分布最广、危害最严重的农业害虫之一。大部分蚜虫在受到天敌攻击时都会从腹管释放报警信息素,以警告同种个体潜在的威胁,而该行为对于蚜虫的综合治理具有重要意
目的:优化食品中甜蜜素的分析方法。方法:采用程序升温毛细管气相色谱法测定食品中甜蜜素的分析方法。结果:方法灵敏度降低,定量准确。结论:采用程序升温毛细管气相色谱法测
<正> 植物的有性杂交在育种工作中是最常用的方法之一。但常常遇到杂种胚败育的情况,特别是远缘杂种胚败育的情况更是普遍。于是研究如何克服胚败育的方法就提到了很重要的地
背景原发性肝癌是世界上最常见的恶性肿瘤之一,据估计每年原发性肝癌的新发病例大约有60万例,其死亡率高,是第3大恶性肿瘤致死疾病。肝细胞癌(hepatocellular carcinoma,HCC)
<正> 党的十一届三中全以后的十年来,我国图书馆事业不仅获得了巨大发展,而且图书馆的性质、职能、任务也发生了重要变化,其中最为突出的就是图书馆由于开展了情报服务,使图
随着逆向工程的发展,三维点云配准技术作为逆向工程技术的重要分支,也得到了越来越广泛的应用。三维点云配准的目的是通过建模得到完整的目标物体,但是在实际的测量过程中,由
当前农村未成年人犯罪的宏观原因是国家的现代化目标激起了农村未成年人关于现代性的想象,但国家的现代化谋略又使他们的现代性想象难以实现;微观原因是农村未成年人不良的社
采集动物血样是动物疫病防控机构实施动物疫病监测和疫苗免疫效果评估工作最基本的工作,对猪、牛、羊、鸡等常用动物血样采集技术及要点进行了分析总结,为基层畜牧兽医工作者