论文部分内容阅读
近年来,在线问答系统的发展越来越迅速,越来越多的用户通过在线问答系统寻找自己想要的信息。诸如百度知道,Quora和Yahoo!Answers等在线问答系统,已经成为用户获取有价值信息和分享知识信息的重要途径。通过在线问答系统,用户可以提出问题,回答问题和对已有的问答信息进行评价。但是,随着在线问答系统的发展,问答系统中的问答信息也越来越多,用户刚刚提交到系统中的问题,就被其他新问题给淹没掉了。该现象可能会造成用户提出来的问题需要等待很长的时间,才可能得到回答。此外,许多问题的回答包含了大量垃圾信息或者广告等无价值信息。因此,有必要研究一种专家发现方法,以便能够快速找到适合回答用户提出问题的用户,从而提高效率。本文的主要工作如下:1.综述了在线问答系统中专家发现相关的已有研究成果,包括在专家发现过程中需要用到的PageRank算法和LDA主题模型的相关原理。通过对传统的PageRank算法进行分析,发现了其自身存在的固有缺陷,对其进行改进可以更好地发现在线问答系统中的专家用户。2.提出了一种基于指数平滑法的专家发现方法。该算法的思路就是对传统的PageRank算法加入了时间因素。在专家发现的过程中,使用到了指数平滑法来预测Stack overflow中用户的发帖量,同时,也加入了趋势因子来预测用户未来发帖量的情况。最后,并通过实验表明了这种改进后算法的有效性。3.提出了一种基于贝叶斯预测的专家发现方法。该算法的思路是在对传统的PageRank算法从时间上进行改进的同时,从主题语义上对PageRank算法也进行了改进。在专家发现过程中,使用了贝叶斯预测方法来预测Stack overflow中用户的发帖量。最后,并通过实验证明了改进后的算法在P@n_Percent的评测结果中要优于传统的PageRank算法。