论文部分内容阅读
随着信息技术的发展以及网络的普及,越来越多的信息充斥在网络上,人们可以不受时间、空间限制的获取信息。然而信息的“爆炸式”增长导致“信息过载”、“资源迷失”等问题相继出现,严重降低了人们利用网络的效率。另一方面,由于我国广大农村地区相对贫穷、农民受教育程度普遍较低等原因导致农村和城市之间出现了明显的“数字鸿沟”,农民群众无法享受到信息化所带来的便利。为此,海口市创造性的提出了“电子农务”这种行之有效的农村信息化推动模式,力图用信息化的手段全面推进海口市农村地区建设。基于潜在语义分析的农户个性化推荐系统作为“电子农务”的一个研究课题,结合了信息技术以及农村实际情况,为农民提供个性化信息服务。本系统定位于为农民提供个性化生产技术服务,首先农户信息档案和语料库,采用基于内容的推荐算法,进行信息推荐。并且,为克服中文信息检索中同义词和多义词的问题,以及解决基于内容的推荐系统所面临的数据稀疏性问题,以提高系统运行效率,本文采用潜在语义分析技术(LSA--Latent Semantic Analysis)。LSA通过奇异值分解技术建立潜在语义空间,将词语和文本都投影到该空间,有效地提高了信息检索的准确率,大大缩短了响应时间。本文首先介绍了潜在语义分析的基本原理,对奇异值分解、潜在语义空更新等技术作了深度挖掘,接着又讨论了中文分词关键技术。其次,本文对权重计算进行了深入分析,提出了“文档全局权重”和“非线性函数”相结合的新权重方案,并且对其进行了详细阐述。最后,本文对基于农户信息的个性化推荐系统进行了详细的需求分析、功能分析,包括模块的设计、实现方法和关键技术,并且编程实现了该推荐系统。该系统结合自然语言处理和个性化推荐,达到了推荐目的。