Web社区推荐方法与系统研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:yxhetao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web社区作为社会化网络(Social Web)的重要组成部分,已经在全球范围获得了巨大成功,并保持高速增长。Web社区由一群追求相同兴趣或目标的人组成,社区成员通过互联网进行交流、沟通与协作。Web社区已经深入到人们日常生活的方方面面,使得人们获取信息更为迅速、交流沟通更为快捷,为民众带来更公平的话语权,为企业创造更公平的竞争环境。互联网上的社区数以亿计,例如Facebook就拥有超过6亿个社区,Web社区巨大的数量和持续的增长趋势,意味着用户在选择社区时面临着严重的信息过载问题。社区推荐是解决该问题最有效的工具。对一般用户而言,Web社区推荐可以帮助用户在海量社区中选择有价值的社区加入,以更好地与其他用户交流、共同学习和工作;对社区提供商而言,Web社区推荐可以吸引用户加入更多社区,促进社区的发展以创造更大的经济价值。因此开展Web社区推荐方法与系统的研究具有重要的社会和经济意义。Web社区拥有鲜明的主题,社区主题是用户聚集的原因;Web社区作为被推荐给用户的项,同时由用户组成,并且用户之间存在社会关系。针对上述Web社区的特性,本文研究内容主要包含以下四个部分。(1)基于潜在主题的准确性Web社区协同推荐方法传统的基于显式主题关联的推荐方法难以应对数据稀疏问题;基于隐式主题关联的推荐方法可以更好地应对数据稀疏问题,但容易产生不准确的推荐结果。针对上述问题,本文提出一种基于潜在主题的准确性Web社区协同推荐方法。该方法首先利用隐式主题关联,得到用户与社区在潜在(隐式)主题上的关联度,将在潜在主题上关联度高的社区推荐给目标用户。然后利用协同过滤思想,提高目标用户的相似用户所加入社区的排名,尽可能去除隐式主题关联可能导致的不准确结果,以提高推荐的准确性。(2)基于用户-社区全域关系的新颖性Web社区推荐方法现有大多数推荐方法属于准确性推荐,该类方法单纯追求推荐的准确性而忽视新颖性。然而一味强调准确性可能会降低推荐系统的质量。本文提出一种基于用户-社区全域关系的新颖性Web社区推荐方法,用户-社区全域关系指Web社区中客观存在的三种交互,即用户-用户、社区-社区以及用户-社区交互。该方法向用户推荐新颖性社区,即用户不知道但有潜在兴趣的社区,旨在扩展用户视野和推动社区本身的发展。该方法首先提出WLDA(Weighted Latent Dirichlet Allocation)算法计算社区对用户的推荐准确度,WLDA利用用户-社区交互的强度提高推荐的准确性。接下来利用用户-社区全域关系定义社区对用户的新颖度,并提出了社区新颖度计算方法。最后为了提高整体推荐质量,利用多目标优化策略融合社区的推荐准确度和新颖度。(3)基于用户-社区全域关系闭包的高效均衡性Web社区推荐方法本文提出基于用户-社区全域关系的传递闭包融合推荐的准确性和新颖性,旨在进行高质量的均衡性Web社区推荐,该传递闭包指Web社区蕴含的用户-用户、用户-社区和社区-社区多阶交互;同时提出包含离线建模和在线推荐的方法框架,旨在提高推荐效率。基于前述传递闭包,NovelRec离线建模用户邻域、邻域用户主题相似度和社区主题距离。该方法利用用户-用户和用户-社区多阶交互,将目标用户的邻域用户加入的社区作为其候选社区,根据邻域用户与候选社区的交互,计算候选社区对目标用户的准确度。该方法利用前述三种多阶交互,提出一种用户-社区距离度量方式,结合该距离、邻域用户在候选社区中的参与度以及社区属性,计算候选社区的新颖度。在此基础上,NovelRec最终进行均衡性社区推荐,兼顾推荐结果的准确性和新颖性。(4)构建Web社区推荐原型系统针对Web社区特性,分别从推荐准确性和新颖性出发,本文提出了三种社区推荐方法。本文在Web社区管理原型系统基础上,加入社区推荐原型系统作为高级应用功能,根据用户在社区中的多种行为、以及社区自身的属性信息,对用户进行准确性、新颖性和均衡性社区推荐。
其他文献
在这篇论文中,我们讨论若干stit逻辑的判定问题。这些逻辑的语言中除了stit算子,还包括时态算子、历史必然算子与知识算子等。本文获得三个主要结论。第一个主要结论是以非决定论的X,Y-时态逻辑为基础的某一类逻辑的可判定性。为了得出这一结论,我们使用子模型和滤模型的方法证明该类逻辑都具有强有穷框架性。这一结论可以被应用于许多具体的逻辑,其中包含我们所关心的结合agency、时态及认知的逻辑,不过语言
第一部分:主动脉夹层与交感神经支配、活性异常相关性研究目的:探讨主动脉夹层与局部交感神经支配、全身交感神经活性之间的相关性。方法:募集主动脉夹层患者以及正常人群,记录血压、心率、呼吸节律、节后肌肉交感神经活性,血清去甲肾上腺素浓度以及年龄、性别、体重等一般数据,统计分析其差异;术中收集主动脉夹层、主动脉瓣置换患者、器官捐献者主动脉壁,免疫组织化学标记交感神经特异性酪氨酸羟化酶、生长相关蛋白43,软
差分演化算法(DE)是基于自然界生物演化原理而提出的一种启发式搜索算法,是当今众多智能算法的杰出代表。过去10年来,DE算法得到快速的发展和广泛应用。与其他的智能算法相比,DE算法具有实现简单、收敛速度快、算法鲁棒性强等突出优点。因此也受到众多研究者的青睐,其各种衍生版本屡次在有关演化计算的国际会议竞赛中获得佳绩。当前,DE算法被广泛应用于求解各类复杂的优化问题,以及诸如科学研究、工程设计、工业生
安徽省绿色矿山建设标准,遵循行业标准的基本要求,针对安徽矿业发展实际,采用开采方式合并矿种的新分类,分为露天开采金属矿绿色矿山建设要求(DB 34/T 3249-2018)、露天开采非金属矿绿色矿山建设要求(DB 34/T 3248-2018)、井采煤矿绿色矿山建设要求(DB 34/T 3247-2018)、地下开采金属矿绿色矿山建设要求(编制中)。新构建的标准体系简洁清晰,突出了采矿、选矿和生态
党的十八大以来,河南坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻落实新时代党的建设总要求,在新时代党的建设实践中积累了宝贵的经验,主要体现在:必须深入贯彻党的建设新理念,必须坚持以党的政治建设为统领,必须深入贯彻"严"的主基调,必须坚持系统观念,必须坚持守正创新。
为最大限度的提高LNG气化站空温式气化器气化率,同时保证设备及其基础支墩不受LNG气化低温被冰水侵蚀爆裂冻涨变形影响运行安全。以往的空温式汽化器都是依据现有的相关经验来进行设计制造的,并且忽略了星型翅片导热管在结霜工况下对传热性能的影响,实际应用偏差较大,有些汽化量不足,影响生产,过大则造成不必要的浪费。因此如何合理设计空温式汽化器,方便工程应用是当前急需解决的问题。国内文献对此进行过不少的理论分
云计算是一种基于互联网的计算模式,能够有效整合分散在不同空间位置的计算资源,如存储、带宽等,为用户提供一个简洁统一的使用接口,因而受到业界的广泛关注与实践,如Amazon、Microsoft、IBM、Google等均推出其云计算解决方案。移动计算是通过移动设备,如智能手机、平板电脑等,进行数据处理,并通过无线网络进行数据传输的计算模式,能够随时随地获取互联网上的信息及服务,极大地改变了人们日常生活
随着互联网的高速发展,人们跨入了信息爆炸的“大数据”时代。人类的大多数的知识和信息是以自然语言(文本、语音)的形式存在。面对海量的语言信息,要自动处理和挖掘里面的知识,就需要采用自然语言处理的技术。同时随着国际交流日益频繁,要打破人们信息交流中的语言障碍,机器翻译技术就是解决这一问题的利器。机器翻译的应用非常广泛,但是其翻译质量并不完美。机器翻译面临着:语义歧义、句法歧义、语序迥异、跨领域翻译等难