社区问答系统中的专家发现方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liioopp123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的不断发展,用户之间的互动成为网络新的发展趋势。社区问答系统为用户的交互提供了便利的平台,这使得社区问答系统必须拥有庞大的知识数据库并能对新提交问题做出及时的反应。在社区问答系统中,用户提交的问题是由其他用户来回答,在庞大的用户群中寻找出专家用户,可以令新出现问题得到及时准确的回答,进一步扩充系统的知识数据库。可见,专家发现对社区问答系统有着重要意义,是社区问答快速发展的有效途径之一。目前,专家发现主要是利用主题模型和链接分析等方法。本文介绍了社区问答中专家发现的研究背景和现有研究成果,对社区问答系统和专家发现问题进行了较为细致的介绍,并描述了文中使用的用于计算用户权威度的链接分析方法和主题模型。基于对上述知识的研究,提出了一种基于类别参与度的专家发现方法,主要使用LDA主题模型来抽取问题类别和用户的话题分布,利用KL距离计算类别相似度以及用户参与度,在某一问题类别进行专家发现时,综合了用户在该问题类别的贡献程度和在与该类别相近似类别中的参与度,最终评定用户在待考察类别是否为专家用户。通过对对在专家发现领域普遍使用PageRank算法的研究分析,结合专家发现问题对传统的PageRank算法进行改进,根据用户提供答案质量的不同对用户链接关系的有向边权重重新定义,其中,答案质量信息通过用户反馈行为获取。本文分析社区问答系统中的用户链接关系,发掘问题类别和用户的主题分布信息,利用用户反馈行为对答案质量进行评价,分别使用了基于类别参与度和基于加权PageRank算法两种方法来进行社区问答中的专家发现。基于类别参与度的方法中用户在相近似类别的贡献加强了在考察问题类别的专家权威度,基于加权PageRank算法根据答案质量不同为连接用户的有向边赋予权值。文中提出的两种方法均在抽取自Yahoo! Answer的真实标记语料集上进行实验,与几种常用的用户权威度计算方法相对比,采用AP@10和MAP两种指标对实验的结果进行评估,实验结果表明本文提出的两种方法在性能上表现均优于其他几种对比方法。
其他文献
Ad Hoc网络是一种新兴的网络互连技术,它不同于Internet互联网,它不需要依赖预先架设的基础网络设施就能快速组网,此外它的移动性也使得它区别于传统无线传感器网络,这使得它
近年来,不少企业为了获得高利润高收益,会有长期超标排放、严重超标排放、偷排漏排、拒绝执法、私设暗管排污等违法违规行为,但行政处罚力度有限,或者难以执行处罚,导致因环
如今,网上课堂由于它获取的便捷性以及资源的丰富性,越来越受到广大学生的欢迎,而在所有的网上课堂中,慕课更是一颗冉冉升起的新星,它的资源更多而且其中还有很多名校的优秀资源,所
对等(P2P)计算是近年来兴起的一种重要网络计算技术,在很多领域都有着大量的研究与应用。随着P2P网络的不断发展,用户对P2P网络中资源的有效性、即时性及传输效率都有了更高
人们在传统搜索引擎上所用到的关键字搜索技术发展成熟,是当今最流行的搜索方式。但是用户输入关键字,搜索自己想要的东西,想表达的意思仅仅用几个关键词并不能完全表达清楚,
作为一种新型的计算模式,云计算正逐渐成为信息产业的最新发展趋势。云计算以其易扩展、按需使用、按使用付费的特点迅速吸引了大量的用户。通过使用云计算,用户不仅降低了在IT
近年来,随着信息化的高速发展,图像处理以及应用日益广泛,然而由此产生的问题也随之而来,比如图像的去噪和对图像质量的评价都是研究者们研究的重要课题。图像在采集、压缩、转换
无线传感器网络负责感知、采集、处理和监控环境数据,但是容易受限于资源。压缩感知理论表明,通过求解最优化问题,稀疏信号可以从少量的非自适应线性投影中得到高概率的精确恢复
如今,智能手机行业飞速发展,尤其是Android智能手机更是得到了广泛普及,成为人们重要的交流工具。但是Android智能手机上恶意软件泛滥,给用户的信息安全带来巨大的威胁。软件检测
随着信息技术的迅猛发展,海量数据日益增长,传统的信号处理模式已经越来越不能够适应这种局面,信号处理能力也受到了极大的挑战。压缩感知理论应运而生。压缩感知理论能够从