UGC环境下社会化问答社区的话题挖掘及问答推荐研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:woshiwangxincheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网不断发展和普及,人类的沟通方式和交流途径发生了巨大的变化。从信息环境的变迁来看,科学技术的发展导致知识和信息呈几何级膨胀,这一态势重新塑造了世界的组织形式和理解方式。从个人角度来看,科学技术特别是信息技术的飞速进步,提升了个人理解世界、获取知识和提升自我的欲望,也正是对知识的渴求,使人类得以存续和发展。在这样的历史环境和技术条件下,随着互联网的发展与普及,人类的智慧和成果可以通过简单的搜索行为从互联网中获取,这种依托互联网获取知识、分享知识和传播知识的方式改变了人类延续千年的知识传承模式。伴随这种网络化知识获取模式的发展和进化,人们为了能够更加便捷、高效和精确的获取信息,以知识传承和共享为中心的互联网节点采用了两种不同的网络应用方式,一是通过以wiki为代表的网络百科全书式,即允许任何用户添加或编辑词条来分享知识,二是通过以在线问答社区为代表的在线知识共享式,即允许所有用户提问和回答的社会化网络在线问答社区。随着大数据技术的深入发展,在线问答社区由于其互动性、广泛性和实时性的特点,在网络知识分享领域具有越来越重要的地位。但伴随在线问答社区的高速成长,信息无序膨胀、数据碎片化、备份数据冗余等问题制约了在线社区的深化发展,导致用户在使用知识社区服务时,搜索、筛选和利用知识的过程中付出的时间成本和机会成本不断增加,同时也出现了问题质量参差不齐、答案质量难以保证、知识难以被有效发掘等现实问题,上述现象也使得用户对垂直化、精准化和个性化的知识需求变得日益迫切。有鉴于此,本文以社会化问答社区的知识服务为本底,将UGC技术和方法引入社会化问答社区的话题挖掘及问答推荐,从面相互联网用户知识需求出发,分析了社会化问答社区中话题生成、解答和推荐等方面的需求,提出了基于UGC技术的社会化问答社区知识服务体系,探讨了互联网用户在提出问题、回答答案、分享知识等活动中的知识关联方式,最终提出促进UGC环境下社会化问答社区的话题挖掘及问答推荐相关策略。本文共分为八个章节。第一章,主要探讨了 UGC环境下社会化问答社区的话题挖掘及问答推荐的研究背景、国内外研究现状、论文的研究思路与技术路线、论文的创新点、论文的研究方法和研究架构。第二章,相关概念和基础理论。本章主要包括3个方面的内容,其一是对UGC和社会化问答社区进行了界定和分析,其二是对上述两个概念的理论体系和研究架构进行梳理和总结,其三是基于UGC的技术特性在社会化问答社区中的技术导向和内容方法。第三章,UGC环境下社会化问答社区话题抽取及问答推荐的关键技术。该章节主要围绕UGC环境下社会化问答社区话题抽取及问答推荐的主要技术进行了阐释,包括话题挖掘技术、问题推荐技术和答案推荐技术三个方面。其中,从技术类型来看主要有LDA主题、卷积神经网络等,从算法类型来看主要有聚类算法、演化算法、数据协同、答案推荐系统等。第四章,UGC环境下社会化问答社区话题与问答的模型构建。该章节首先通过运用社会化问答社区用户知识需求模型,对UGC环境下社会化问答社区的话题与问答的相关需求进行分析,在梳理和总结社会化问答社区用户的知识需求特性的基础上,构建UGC环境下社会化问答社区话题和问答的动态模型,并结合动态演化理论对改模型进行了关系表述和解构设计。第五章,基于主题模型的在线问答社区话题挖掘研究。该章节围绕基于主题模型的在线问答社区话题挖掘为实验对象,综合运用LDA算法、伪代码实现、演化模型设计等技术,通过研究方法设计、实验过程表述和试验结果分析的整体过程对基于主题模型的在线问答社区话题挖掘进行实验研究。第六章,基于多源混合标签的社会化问答社区的问题推荐研究。该章节主要以多源混合标签的社会化问答社区为实验对象,通过设计以社会标签自动标注、多远混合标签库和基于标签匹配的协同过滤推荐为主要内容的实验,对相关社会化问答社区的问题推荐进行了评价和分析。第七章,基于双向长期和短期记忆网络的答案推荐方法。该章节主要以双向长期和短期记忆网络答案推荐方法为实验对象,以卷积神经网络及其相关的词向量模型、相关度计算等为关键技术,进行了实验室设计和结果分析。第八章,结论与展望。阐释了本文的研究结论和不足之处,同时对今后的研究方向进行了探讨。论文研究表明,技术研究人员可以通过问答聚类、内容抽取、语义挖掘等技术,探索它们的特征与作用,同时通过分析用户信息和知识内容,建立相关的模型和推荐算法,为平台建立稳固的问答推荐机制。
其他文献
橙汁(Orange juice,OJ)营养丰富、酸甜可口、价格适中,深受广大消费者喜爱。根据美国农业部数据显示:2020年全球橙汁产量为181.2万吨,较2019年的154.5万吨同比增长17.28%,橙汁产业具有巨大的市场前景。杀菌是橙汁加工过程中的关键环节,这是由于橙汁中含有多种致病菌、腐败菌和发酵菌,显著影响橙汁品质。其中,腐败菌中的酸土脂环酸芽孢杆菌(Alicyclobacillus ac
与法律责任领域中的刑事责任相比,民事责任的本体论研究近来并未受到法理学界应有的重视。相较于刑事责任早已抛弃“后果论”,并取得丰富的研究成果,我国民法学界对民事责任的认识始终停留于“后果论”,未能将民事责任的认识向前推进。基于此,本文选取民事责任作为研究对象,尝试从哲学中的评价论视角对其进行法理分析,以期进一步丰富和深化对“民事责任”,进而对“法律责任”的理解。理论上,要全面深刻理解民事责任,必须弄
加强和改进高校青年教师思想政治工作,关系教育强国建设、高等教育事业发展、优秀人才培养以及教师自身专业成长,具有重要战略意义。中国特色社会主义进入了新时代,中国高等教育发展方向怎么走,社会主义建设者和接班人灵魂铸育成几何,从某种意义上讲,决定权就掌握在高校青年教师手中。这迫切需要加强和改进高校青年教师思想政治工作,努力“培养造就堪当民族复兴大任的大国良师”。目前来看,较之于“学生思想政治工作”研究而
协商民主作为中国社会主义民主的重要形式,是建立在马克思主义基础之上并结合中国的国情,对接不同社会历史发展阶段、符合不同发展时期的现实需求,在此过程中产生并逐步发展完善起来的。在中国特色社会主义民主的整体建设与不断推进中,协商民主的实践发展与理论建构发挥了重要的作用。“社会主义协商民主”的概念是在中国共产党第十八次全国代表大会上被正式提出的,事关我国民主政治的未来发展方向与发展重点,是中国共产党以极
道家以伏羲和黄帝为远祖,以伊尹和姜太公为近祖,在春秋末期由老子著《老子》而正式成立。道家以“道”为其哲学之宗,注重身国同治,守正可以治国出奇可以应变。自从道家产生以来,由于其哲学根基之厚重,使得道家有着顽强的生命力,同时道家注重顺应时势破旧立新,所以道家思想逐渐演变成博大精深的理论体系。而道家政治思想就是道家思想中的重要组成部分,本文就是截取道家政治思想发展史上具有代表性的典型人物、经典著作、实践
中国制造业在由大变强的过程中遇到了一些挑战:首先是关键技术领域短板突显;第二是比较优势逐渐减弱;第三是国际竞争日渐加剧。面对“内忧外患”,中国制造业迫切需要实现转型升级,迈向稳定健康可持续发展的新轨道。数字经济以其数字化的信息和知识、具有强大先导性、渗透性和融合性的信息通信技术,以及互联互通的信息网络,渗透进传统产业的方方面面,改变着其技术创新模式、资源要素结构和市场需求特征,为中国制造业转型升级
改革开放以来,我国经济持续高速增长,人均收入水平不断提高,当前已处于上中等收入国家行列。伴随着经济的高速增长,金融体系的规模也不断扩大,金融中介、金融市场、金融机构数量不断增多,金融监管逐步建立健全,金融体制不断完善,逐步形成了多元化的金融结构体系。然而,进入新时代以来,我国经济增速逐渐放缓,经济高速增长过程中长期积累的结构性矛盾已经逐渐显现。习近平总书记在中国共产党第十九次全国代表大会报告中指出
人工智能的发展引起了社会各界的广泛关注。随着人工智能向人类生产生活各个方面的渗透,如何看待人工智能的发展,处理好人与人工智能的关系也成为目前的热点和前沿问题。作为马克思主义理论的研究者,要对人工智能问题加以研究,选择一个恰当的切入点是十分必要的。通过分析,我们以马克思的机器观为切入点,选择与机器和人工智能两个概念都联系密切的智能机器作为对象,并以马克思的机器观为指导研究智能机器问题。马克思的机器观
生态文明建设,是关乎人民福祉、关系中华民族永续发展的长远大计。党和国家历来十分重视生态环境保护工作,特别是党的十八大以来,生态文明建设战略地位凸显,制度出台频度之密、监管执法尺度之严、污染治理力度之大、环境质量改善速度之快前所未有,生态文明理念日益为人民群众所接受,生态文明事业取得了全局性变化和历史性成就。然而,我们必须清醒地认识到,国内生态环境保护形势依然严峻,特别是乡村生态文明建设中的诸多问题
抗战时期,陕甘宁边区的通货膨胀是中共执政史上的一次严峻挑战。自1941年直至抗战结束,陕甘宁边区的通货膨胀几经反复,不仅给边区人民的生活造成了严重困难,而且损害了中共和陕甘宁边区政府的威信。抗战时期,陕甘宁边区通货膨胀的过程极为复杂,中共和边区政府对通货膨胀的治理也充满艰辛。本文以抗战时期陕甘宁边区通货膨胀为研究对象,从通货膨胀的发生原因、发展过程、影响及治理等方面入手,对抗战时期陕甘宁边区通货膨