论文部分内容阅读
随着Web2.0的快速发展,知识社区中专家与用户之间的互动成为互联网发展中流行的趋势。在知识社区为用户提供的个性化服务中,专家贡献度的评价是知识社区研究中必不可少的一个部分。知识社区成为专家与用户之间沟通的重要桥梁,这使得知识社区必须拥有大量的专家,丰富的知识库资源以及能对用户提交的新问题做出及时快速的回答。本文研究的知识社区中,用户提交的问题是由擅长专业领域知识的专家来回答,在庞大的专家群中寻找出对知识社区做出卓越贡献并且拥有很高权威程度的专家,可以促进知识社区的蓬勃发展,使得用户提出的新问题得到及时有效地回答,同时能够扩充知识社区的知识库资源。可见,专家贡献度的评价对知识社区的发展有着重要而深远的意义,是知识社区繁荣发展的有效途径之一。如何从海量的专家中识别出高质量的专家已经成为知识社区研究中的一项极为重要的工作。目前,专家贡献度的评价方法主要是利用Google的核心技术链接分析以及LDA主题模型。本文详细地研究了知识社区和专家贡献度评价问题,通过引入专业领域渗透度的概念,并用专家的权威度和贡献度对专家进行评价。以下是本文的主要工作:1.分析了知识社区中专家与用户之间的问答链接结构,构建了专家与用户之间的链接关系有向图,使用LDA主题模型来挖掘问题答案所属的专业领域主题分布和专家涉及的专业领域主题分布,形成适合知识社区中专家专业领域主题挖掘的模型。2.给出了一种基于专业领域渗透度的专家贡献度评价方法。利用KL距离计算专业领域之间的相似度以及专家在各个专业领域的渗透度。在某一专业领域中评价专家的贡献度时,综合了专家在该专业领域的贡献程度和在与该专业领域相近似专业领域中的渗透度,最终作为专家在知识社区中的贡献度。3.针对PageRank算法中专家的贡献度值均匀传递的问题,仅仅依靠专家与用户之间的链接关系来排名的不足,结合知识社区中专家自身的行为特征,构建了专家的活跃度、专家的受欢迎度和专家的知识贡献能力三个评价指标,添加到原有的算法中,改进了传统的PageRank算法。通过来自百度知道的数据集,进行了两种方法的实验验证,与几种常用的专家权威度评价方法对比后,采用AP@10、MAP指标评估实验效果,结果表明本文给出的方法提高了专家贡献度评价的性能,专家在相近似专业领域的贡献提高了专家在知识社区中问题答案所属领域的专家贡献的程度,而改进的PageRank算法中排名更准确。