语义重叠社区发现方法研究

来源 :哈尔滨工程大学 | 被引量 : 1次 | 上传用户:sl2260ygl2260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络通讯技术的发展,电子社交网络如Facebook,Twitter等,已成为人们日常生活中不可分割的社交渠道。为丰富用户的web社区生活,各社交网站推出了“社区推荐”及“好友圈”服务。由此而生的社区划分及社区推荐算法,已成为社会网络数据挖掘研究的热点。近年来,由于文本信息成为社会活动的主要传播载体,因此面向文本语义信息分析的社区挖掘,成为传统社区挖掘研究领域的新方向。本文的主要研究内容为语义社区发现,其研究目标是通过对社会网络中节点的语义分析及拓扑相关性分析,挖掘语义与拓扑关系紧密的社区结构,并在语义社区发现的基础上保障社区的可重叠性。为此,本文的研究工作分别从以下4个方面进行开展:多元相关性研究、场势相关性研究、局部区域相关性研究及传播动力学研究。针对一般社会网络社区发现算法仅考虑各节点的邻接关系,所划分的社区仅为一元关系社区不能代表社区成员的语义相似性且无法处理具有多元语义话题的语义社会网络社区发现问题,提出基于话题因子分析的语义社会网络社区发现算法FA-SA(Factor Analysis$Simulated Annealing)。该算法将节点的多元信息抽象为话题,先以多元话题综合因子作为节点话题信息度量,以节点间的话题密度差异作为节点聚合方向,构建初始社区结构;再以最大化社区内部话题信息相似度和最小化社区外部话题信息相似度为目标建立语义社区发现的目标函数及节点变动的代价函数;再以初始社区结构和代价函数作为初始解和判断准则,以节点变动的代价函数值为参数,建立全局优化的模拟退火策略优化语义社区结构,实现多元语义社会网络的语义社区发现。针对场势相关性问题,提出基于语义数据场的语义重叠社区发现算法SFR(Semantic Field Randwalk),该算法首先以LDA(Latent Dirichlet Allocation)模型为语义信息模型,利用Gibbs取样法建立节点语义信息到语义空间的量化映射;其次,利用节点间语义坐标及链接关系,建立节点的语义数据场模型;再次,以语义关系强度及语义势能为参数,提出一种改进的语义社会网络重叠社区发现的随机游走策略。针对局部区域相关性问题,提出基于局部语义聚类的语义社会网络重叠社区发现算法,该算法首先以LDA模型为语义信息模型,利用Gibbs取样法建立节点语义信息到语义空间的量化映射;其次,以节点间语义坐标的相对熵(KL散度)作为节点语义相似度的度量,建立节点相似度矩阵;再次,根据社会网络的局部小世界特性,提出语义社会网络的局部社区结构S-fitness模型,并根据S-fitness模型建立了局部语义聚类算法LSC(Local Semantic Clustering)。针对传播动力学问题,提出标签传播的语义重叠社区发现算法,该算法首先以LDA模型为语义信息模型,利用Gibbs取样法建立节点语义信息到语义空间的量化映射;其次,提出可度量节点间相似性的主成分SCNP(Semantic Coherent Neighborhood Propinquity)模型,以及语义影响力模型SI(Semantic Impact);再次,以SCNP作为标签传播的权重,以SI作为截断阈值的参数,提出一种改进的Semantic-LPA(Semantic Label Propagation Algorithm)算法。针对LDA取样在网络拓扑结构的优化求解问题,提出一种面向语义重叠社区发现的block场采样算法,该算法首先以LDA模型为语义信息模型,建立了以取样节点为核心节点的block场BAT(Block-Author-Topic)语义取样模型;其次,根据节点的语义分析结果,建立可度量block区域的语义凝聚力方法,实现了语义信息的可度量化;最后,以节点的语义凝聚力为输入,改进了重叠社区发现的标签传播算法。
其他文献
目的本研究主要探讨中性粒细胞明胶酶相关脂钙蛋白(neutrophil gelatinase-associated lipo-calin,NGAL)在慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)中
为了解肿瘤患者化疗期间健康教育需要,实施针对性护理,笔者对106例肿瘤患者健康教育需要进行调查,现将结果报告如下。
商务部新闻发言人姚坚近日表示,针对干旱等极端天气对粮食生产可能造成的影响,商务部主要承担两项任务:一是进一步做好粮食的进出口调控;二是保证国内市场的有效供应。姚坚说:“粮
<正> 随着社会的进步和人民生活水平的提高,社会交往日益频繁,越来越多的人希望保留松动牙、提高咀嚼效率,并且对美的追求越来越强烈。目前临床上已有较多的松牙固定法,多因
1999-01~2004-02我院联合应用生长抑素和胃肠外营养治疗贲门癌术后吻合口瘘11例,效果满意,护理体会如下.1 对象和方法1.1 对象本组男7例,女4例,年龄52~69岁,平均61.7岁.手术经
新课改对初中数学教学提出了更高的要求,要提升教学的有效性,就应改变以往学生单纯记忆以及机械式套用知识的学习方式,要强调以学生为主体的自主探究性学习,学生要自己建立知
边疆地区自古以来都是东西方文化交流与汇聚的重要之地,在这里所表现出来的民俗艺术直接反映了当地不同民族居民独有的生活方式、民俗风俗及文化特点,而且对东西方文化的发展
我院2003-03~2003-11采用153Sm-EDTMP治疗肿瘤多发性骨转移15例,结果总结如下.
苗族图案造型大方,朴实,生动,构图丰满,色彩艳丽,对比强烈,体现了苗族人民独特的审美水平和民族特点。苗族人没有自己的文字,以图案的形式传承民族文化,图案的纹样和内容浓缩
通过对显德汪矿煤层顶板岩性及岩层结构特征的分析,论述了用锚杆钻机确定煤层顶板岩性及岩层结构的方法.