社会化问答网站中话题推荐系统的研究

被引量 : 5次 | 上传用户:aiyouxizhiwojian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会化问答网站是区别于传统问答网站(如百度知道,新浪爱问等)的新兴问答网站。最初提出社会化问答网站的概念的公司是美国的Quora(www.quora.com)。该网站由Facebook前雇员查理·切沃(Charlie Cheever)和亚当·安捷罗(Adam D’Angelo)于2009年创办。Quora令人兴奋的地方在于,用户可以找到最适合的答案,被称为“流动的维基百科”。该网站的模式是:任何网民成为该网站的注册用户后,可使用各自真实身份回答其他用户提出的问题。这种问答服务与维基百科颇为相似。更为重要的是,Quora引进了社会化关系的概念,用户可以可以关注一个话题、一个问题,也可以关注一个人的所有问答,用户还可对同一个问题的多个答案进行投票等。过去两年里,Web2.0时代的新型问答网站——社会化问答网站如雨后春笋般涌现出来,这类网站将问答与社交结合起来,通过引入用户之间的关系来发现和筛选问题及答案。目前,社会化问答网站还只是在起步的阶段,用户发掘优质内容的方式还很单一,搜索引擎仍然是最重要的入口,那么,如何利用数据挖掘和自然语言处理的相关技术来为社会化问答系统设计一套推荐算法就成了亟待解决的问题。本文结合自然语言处理以及数据挖掘中的相关技术,对中文社会化问答网站的数据进行分析建模,根据中文语言的特点,设计了一套基于隐语义模型的话题推荐算法。主要的贡献有:提出了一种基于编码Trie树的分词词典数据结构,实验结果表明,与传统的分词词典构造结构相比,在分词的效率上有较大提升;话题识别是问答网站中的重要功能,针对传统的搜索引擎搜索话题在相关性和多样性上的不足,本文提出了一种基于LDA与KNN结合的话题抽取算法。实验结果表明,该算法在准确率以及召回率上相较传统算法有较大提升。
其他文献
先知文化是希伯来文化的重要组成部分,它在一定程度上确立了希伯来人思考和想象的空间,影响了希伯来人经验世界和阐释世界的方式。希伯来人并不试图从先知话语中寻找微言大义
质量成本四要素的权衡关系表明,预防和鉴定成本的增加将会导致内外部损失成本的减少,反之亦然。确定质量成本各要素的最佳比例关系,使得总质量成本达到最低是至关重要的。本
[目的]探讨消化道肿瘤病人的知情程度对生活质量以及满意度的影响。[方法]将2014年8月—2016年10月收治的120例接受化疗的消化道肿瘤病人依据知情程度分为完全知情组、部分知
工矿企业和发电厂里大量使用的高压电机故障多为转子振动超标或转子烧毁,本文通过振动原因分析及处理方法,介绍铜条鼠笼转子采取更换整体铸铝转子的方法,实践效果好,取得了成
本文以2009~2014年中国国有上市公司为样本,基于内外部治理的视角,研究内部控制与媒体治理对我国国企投资行为的影响,结果表明:内部控制与媒体治理在抑制企业投资中的扩张行
为了探明相对剥夺感对攻击性的影响,本研究以新兴弱势群体——初就业本科生为研究对象,在完成对相对剥夺感量表重测的基础上探究相对剥夺感与攻击性的关系。研究分为两个部分
随着电力数据总量的急速增长,电力大数据时代已经来临,智能电网建设的逐步推进对数据处理的可靠性和实时性提出了更高要求。近年来云计算技术迅速发展,分布式处理平台不断涌
范长江是我国杰出的新闻工作者,在中国现代新闻史上创造了一系列的新闻奇迹,并形成了自己独特的新闻思想。其新闻思想包括:坚持正确的政治方向、实事求是和"民本"思想。范长
本文针对大学章程的制定工作正在推行的现实,论述了大学章程在大学治理中的价值与实现策略。作者认为,大学章程在大学运行过程中的价值体现为权力关系的梳理与规范,即分配权
当代大学生属于“数字土著”,他们是伴随着数字产品成长起来的新一代。社交媒体是他们进行沟通交流重要方式。但是,由于他们在应用社交媒体时缺乏责任意识,导致各种社会问题