论文部分内容阅读
电厂的安全生产问题一直是电力生产的重中之重,电厂愈发的重视其自身的安全规范,越来越重视对员工进行安全培训。基于B/S结构的安规培训管理系统采用服务器-浏览器的模式实现了电厂在线完成安规考核和学习任务,有效地提高了电厂人员的学习效率。但随着题库题量不断地扩充,手动检索出适合用户练习的题目将花费大量时间,本文所提出的推荐系统就是在安规考核系统中加入试题推荐功能,系统可以根据用户每个人对知识的掌握情况推荐适合其练习的题目,提高学习的效率。本文主要完成了以下内容:1.研究了基于用户的协同过滤算法和基于物品的协同过滤算法,比较两者在不同推荐系统中的应用情况,比较其优缺点。结合安规考核系统的实际情况采用基于物品的协同过滤算法实现本课题的研究,根据需求在数据库中设计用于保存用户-物品评分矩阵和物品-物品相似度矩阵的数据表。2.学习中文分词技术,收集题库中的题目,去除文本中的标点符号进行数据预处理。测试并比较了Stanford、Snown Lp、结巴分词等几个常用的中文分词工具,最终选用了结巴分词器进行分词。3.统计部分用户的错题信息生成用户-物品评分矩阵并保存到数据库中;对每道题目进行中文分词,比较不同的文本向量化算法优劣,验证后选取了TF-IDF算法进行文本向量化,基于2生成的词库构建词向量,采用欧式距离两两计算题目之间的距离,将计算得到的距离值做为题目的相似度,构建物品-物品相似度矩阵并保存到数据库中。4.根据用户-物品评分矩阵和物品-物品相似度矩阵生成推荐列表,完成推荐系统其它功能的设计,使试题推荐功能可以投入使用,当用户使用该功能时,系统可根据用户之前的错题情况对用户推荐相近的题目。