论文部分内容阅读
随着Web2.0的不断发展,用户之间的互动成为网络新的发展趋势。社区问答系统为用户的交互提供了便利的平台,这使得社区问答系统必须拥有庞大的知识数据库并能对新提交问题做出及时的反应。在社区问答系统中,用户提交的问题是由其他用户来回答,在庞大的用户群中寻找出专家用户,可以令新出现问题得到及时准确的回答,进一步扩充系统的知识数据库。可见,专家发现对社区问答系统有着重要意义,是社区问答快速发展的有效途径之一。目前,专家发现主要是利用主题模型和链接分析等方法。本文介绍了社区问答中专家发现的研究背景和现有研究成果,对社区问答系统和专家发现问题进行了较为细致的介绍,并描述了文中使用的用于计算用户权威度的链接分析方法和主题模型。基于对上述知识的研究,提出了一种基于类别参与度的专家发现方法,主要使用LDA主题模型来抽取问题类别和用户的话题分布,利用KL距离计算类别相似度以及用户参与度,在某一问题类别进行专家发现时,综合了用户在该问题类别的贡献程度和在与该类别相近似类别中的参与度,最终评定用户在待考察类别是否为专家用户。通过对对在专家发现领域普遍使用PageRank算法的研究分析,结合专家发现问题对传统的PageRank算法进行改进,根据用户提供答案质量的不同对用户链接关系的有向边权重重新定义,其中,答案质量信息通过用户反馈行为获取。本文分析社区问答系统中的用户链接关系,发掘问题类别和用户的主题分布信息,利用用户反馈行为对答案质量进行评价,分别使用了基于类别参与度和基于加权PageRank算法两种方法来进行社区问答中的专家发现。基于类别参与度的方法中用户在相近似类别的贡献加强了在考察问题类别的专家权威度,基于加权PageRank算法根据答案质量不同为连接用户的有向边赋予权值。文中提出的两种方法均在抽取自Yahoo! Answer的真实标记语料集上进行实验,与几种常用的用户权威度计算方法相对比,采用AP@10和MAP两种指标对实验的结果进行评估,实验结果表明本文提出的两种方法在性能上表现均优于其他几种对比方法。