基于潜在空间向量模型的信息扩散算法研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:yanlj007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的兴起,信息扩散已成为近几年热门的研究领域。信息扩散的定义是信息通过用户间的交互行为而到达个体的过程。信息扩散一般可以分成突发话题检测、社区发现、信息源检测、和链接预测四个研究领域,而扩散预测是链接预测衍生出的一个分支领域,用于预测哪些用户会参与到信息的传播过程。目前传统的信息扩散方法可以分为相似度模型和概率模型,前者希望能够通过找到网络结构内在的规律,将相似度高的节点用户放在一起,并且假设越相似的用户彼此越容易影响;后者则通过参数模型特征,通过最大化(或最小化,视模型而定)目标函数求得最优参数解。然而这两类模型均存在自身局限性:1)相似度模型需要底层社交网络和其他用户信息作为模型的特征输入,而这类信息在获取上存在困难;2)概率模型着眼于全局信息结构,效率较低,无法处理大规模数据。基于上述局限性,本论文提出了基于潜在空间向量的信息扩散算法。通过从核函数和特征学习两个角度,构建潜在空间,并用向量表示用户和用户的特征行为,从而可以直接通过信息序列优化向量,无需额外的社交网络信息等特征;同时引入三元组将序列比较转化为成对比较,并且通过相关算法,将用户参与消息传播的时间先后顺序转变为潜在空间的欧式距离的远近问题,降低了运算的时间复杂度,较大程度提升了运算的效率。为验证模型的效果,将此模型同三个常用扩散预测模型相比较,在三个真实的社交数据集上进行测试,并用平均准确率作为衡量标准,就结果作出了相应的分析。通过实验证实,基于潜在空间向量模型的信息扩散算法的效果是最好的。最后在现有模型的基础上进行优化,引入了话题属性作为模型的特征,通过tf-idf和主成分分析算法降维、k-means聚类的方式将话题特征融入到现有模型中,从而进一步提升了实验结果。
其他文献
最近几年,伴随着移动互联网的迅猛发展,互联网已经融入到了我们的日常生活当中,让我们的生活变得越来越便利。然而,随着互联网产生的数据量呈现出爆炸式的增长,我们需要花费
由于二进制消息帧、多路复用和服务器推送等机制的引入,HTTP/2协议在带来网络性能提升的同时,也使得HTTP/1.1协议还原方法无法适用于HTTP/2协议还原。本课题通过对二进制消息
桩基础以其稳定性、耐久性优良等优点被应用于土木工程的各个领域,液化土中桩基础动力响应规律一直是岩土工程抗震领域关注的热点。以往研究表明不同的地震动强度对群桩的破
随着互联网技术的高速发展和信息时代的到来,互联网相关应用已经深深影响到到人类社会生活的方方面面。网络的大量使用造成了互联网数据的爆发式增长,加重了网络安全和网络监
可见光通信(Visible Light Communication,VLC)作为一种新兴的无线通信技术,可以在满足照明的同时实现通信功能。VLC可以利用巨大的且无需注册的免费可见光频谱资源,从而缓解
无线通信技术的普及和智能终端的发展,为用户的工作学习娱乐提供了极大的便捷,绝大多数的移动智能终端都可以进行WiFi连接,通过监测用户智能终端的WiFi信号,可以获得用户手机
认知无线电的主要技术就是动态利用处于空闲状态的频谱,频谱检测就是检测通信环境中的可用频谱,将频谱分配给认知用户通信。认知无线电(CR)终端对于特定区域的频段进行分析,
超级电容器作为新型储能装置,可以提供比可充电电池高1-2个数量级的功率密度,并且比传统的静电电容器存储更多的能量。结合其快的充放电速率、长的使用寿命、高的库伦效率、低的维护成本和安全操作的优点,超级电容器可以为便携式电子设备、电动汽车和大型智能电网等各种应用提供多种供电解决方案。在众多超级电容器材料中,二氧化锰因其高的理论电容(1370 F g-1)、丰富的储量、相对低廉的成本,近些年受到研究者的
随着移动终端数量的爆发式增长,传统的基于宏基站的蜂窝网络已无法完全满足用户的流量需求。异构网络(Heterogeneous Networks,HetNets)作为一种灵活、经济的无线网络架构,能
随着室内无线系统在办公楼,工厂,展览馆以及相关环境中使用的增加,可以应用于多种室内环境的高效传播模型的需求也随之被提出。为了解决室内分布的相关问题,室内传播损耗模型