基于关联规则和文本分类的推荐算法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:skyaixiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的发展,在网络文本的大量产生和传播现状下,使得文本分类、文本摘要提取、文本推荐等逐渐成为网络文本挖掘研究的热点问题。针对这些问题,本文做了以下研究:(1)针对K-means算法对初始聚类中心敏感,针对不规则聚类簇效果较差的缺点,提出了两种基于K-means聚类的改进算法。对于K-means算法会对不规则类簇聚类效果差的问题,通过每次迭代时,在每个特征维度上校准来实现较为精确的中心调整。在20 Newsgroups等数据集实验表明,该算法在F1-measure指标上较其他两种算法,提升了分类精度。(2)基于关键词过滤和潜在语义结合的文本摘要方法。首先使用EM算法对样本文章进行篇章分割,然后通过聚类对分割后所得块进行聚类,综合方法尽可能的选择权重、排名较高的句子。同时还研究了不同的加权方案对文本摘要性能的影响。(3)基于规则的文本推荐方法。提出了一个基于规则的文本推荐方法,对随机抽样数据进行聚类,基于样本集中的潜在规则和内容相似性进行推荐。实验结果表明,与其他推荐方法相比,文中方法具有较好的推荐多样性和推荐准确度。最后本文综合聚类算法和基于规则的推荐算法,提出了一种新闻推荐方法,向用户推荐有针对性并且多样化的新闻。
其他文献
物流一体化是京津冀一体化发展的重要组成部分,目前,物流标准化发展是物流一体化发展的巨大阻力。文章从物流标准制定的角度,根据京津冀物流一体化相关的政策,将物流标准分为
现阶段,随着我国公路桥梁工程日益增多,基于施工质量、施工安全及施工效率需求,加强现浇箱梁施工技术质量尤为重要。文章通过对公路桥梁施工中现浇箱梁的施工技术应用进行分
用傅氏变换法求解波动方程,对工程地震勘探进行了数值模拟计算,并研究了该算法的频散特性及其稳定性。
1 认知网络的出现1999年,Joseph Mitola Ⅲ提出了认知无线电(Cognitive Radio)的概念.随着无线电技术的不断发展,其应用也越来越广泛,使用领域越来越多.然而在一定的区域、时间、条
认知无线电(Cognitive Radio)和认知网络(Cognitive Network)的提出和快速发展源于日益增长的网络可靠性、可用性和适应性要求。本文从当前网络面临的问题出发,首先介绍了认
本文对超声波辅助作用下,模拟柴油在均相体系中氧化脱硫反应动力学进行研究,研究得到过氧化氢在甲酸催化下与DBT反应为一级反应,反应活化能为Ea=51.152 kJ/mol,反应的指前因
《诗经》行世至屈骚诞生,时间相隔二百余年。出于外交等政治场合的需要,《诗经》一直在各诸侯国之间流播传扬。楚国乃南土大国,与中原文化保持着较为密切的关系。作为《楚辞
城镇排水系统是城镇建设、环境保护、防洪排涝的重要设施,关系到社会经济稳定发展和人民生活的安定。随着城镇建设的迅速发展,城镇排水管网系统的服务面积日益扩大,从而使管
在试验研究基础上,根据型钢混凝土(SRC)异形柱的工作机理,对SRC异形柱的正截面承载力进行有限元数值分析,把型钢和混凝土分别进行单元划分,对型钢单元采用不同的坐标系进行处
随着知识经济时代的到来,我国市场经济体制改革不断深化。一些事业单位管理人员认识到人力资源在事业单位发展中的重要性,加强人力资源的管理和优化力度,从而使人力资源成为