论文部分内容阅读
伴随着互联网的出现和信息技术的迅猛发展,互联网已经与人们日常生活息息相关。他们可以从网络中获取有价值的信息、可以和素未谋面的网民进行在线交流、也可以与远在异地的朋友联络感情、还可以在网络上娱乐休闲。然而,由于网络信息的海量性和异质性导致“信息过载”和“知识迷向”等问题。所以,他们需要网络意见领袖给他们指点迷津。目前,关于意见领袖获取的研究还存在一些不足之处,主要体现在以下几方面:没有考虑到意见领袖受特定知识领域的限制;没有考虑到标签与潜在主题之间的关系,随着信息量的迅速增加,计算难度和规模也逐渐增大,从而增加了意见领袖获取的难度;目前的研究仍停留在小型简单网络的基础上,对于大型网络而言,可操作性较差。为了解决意见领袖发现研究存在的问题,本论文以虚拟社区意见领袖获取为背景,以汽车论坛为研究对象,以克服意见领袖领域受限等问题,提高意见领袖发现质量为研究目的,本论文主要从以下角度研究:(1)基于LDA的潜在主题发现研究分析了网络用户、标签与评论资源之间的潜在语义关系,引入了产生式概率(LDA)模型并对其进行改进,通过LDA潜在主题发现方法获取用户评论的潜在主题,将标签映射到特定主题下直观展现主题,实验证明,该方法能较好的将大量用户评论内容按潜在主题进行分类。(2)基于特定主题的意见领袖指标体系研究根据意见领袖的特点,针对特定主题利用社会网络分析方法中的点度中心度、中间中心度和接近中心度以及网民的活跃性、支持度和传染性构建意见领袖指标体系。(3)基于特定主题的意见领袖识别方法研究在指标体系研究的基础上提出了意见领袖识别方法,借助潜在主题分析,解决了意见领袖领域受限问题,并且本文在指标权重的赋值上,采用了最大离差法,克服了前人研究中权重赋值主观色彩较浓的缺陷。(4)意见领袖识别案例研究在潜在主题分析和意见领袖识别方法研究的基础上,以汽车论坛上抓取的信息为数据源,设计并开发了基于SNA的意见领袖挖掘系统,研究了系统的技术架构和体系结构,并对系统各功能模块进行了详细分析,实现了系统中的主要功能并给出系统运行效果图。