论文部分内容阅读
在我国的各大高校中,学院级办公系统的建立、运行和维护对于整个学院正常教学科研及管理工作的展开有着重要的意义。伴随人数的上升和办学性质的多样化,办公室里需要处理的数据和信息也越来越繁杂,使用人工配置的方法越来越难以完成预期的任务,因此怎样合理高效地配置及优化教学资源是办公系统中的一项关键技术。通过设计自动化的推荐系统,有助于有效优化配置教学资源,为用户提供适当的所需的资源。本文在此背景下,设计并实现了一个用于学院级文档信息个性化推荐的系统,针对学院信息资源的现状和不同用户的具体需求,采用一套行之有效的解决方案,对搜集的不同的信息进行自动分类,代替用户评估它从未看过的内容,以实现信息资源的个性化推荐与分配。本文的主要内容有:1、研究了文档信息的词汇切分方法,在分析和比较现有方法的优缺点基础上提出了基于词典和基于词频统计相结合的切分方法。在已有词典的基础上生成有向无环图,用动态规划的方法寻找切分概率最大的分法作为系统输出。这种方法性能良好,对于未被词典收录的词语也能进行相对准确的切分。2、讨论了资源与用户之间相似度的计算方法,通过建立向量空间模型,分析用户和资源的各项属性,提出一套行之有效的算法将资源与用户抽象成空间中的一系列向量。通过计算用户向量和资源向量之间的相似度来模拟资源与用户之间的相似程度。3、讨论了如何实现信息资源的个性化推荐。介绍了推荐系统的基本情况和目前的发展状况,介绍了本文设计的推荐系统的总结构以及现有的三种主要推荐系统。针对学院办公的需求,结合前两种推荐系统的优缺点,重点分析了适用于解决目前所面临问题的混合推荐算法,给出了算法的实现步骤及实验结果,最后分析了推荐算法的准确性。