论文部分内容阅读
当前社会,在大数据迅猛发展的势头下,信息量呈现出爆炸式增长。面对海量数据的冲击,越来越多的用户需要个性化和针对性的信息推荐,高校图书馆作为高校学术研究的主要信息提供源,虽然在个性化信息资源推荐方面取得了一定研究进展,但由于自身的封闭性和局限性,已有的资源推荐方法并没有考虑过当前社会热点。另一方面随着社会化媒体迅速崛起,微博、微信、BBS论坛等社交网络每天都在以上亿条的速度产生用户生成内容。这些内容直接反映了当前社会热点及全民信息关注点,具有很高的信息价值。因此突破高校图书馆信息资源的局限性,将社会热点与高校信息资源相结合引入到资源推荐当中去,对于高校图书馆自身的建设具有重要的意义。为了提高高校图书馆资源服务的有效性和精准性,本文将社会化媒体热点发现引入到高校图书馆信息资源推荐的研究中去,通过改进热点发现算法实现从社会化媒体中发现当前学科领域的热点和研究前沿,在已经获取热点的基础上,进而提出一种结合了当前热点的基于内容的高校图书馆书目资源推荐方法,这种个性化书目资源推荐方法既考虑了当前领域内的热点又照顾到用户兴趣,使得用户能够获得既符合自身兴趣又符合当前研究趋势的信息资源。本文首先对国内外热点发现及信息资源推荐相关研究进行梳理总结,指出目前在这两方面国内外的研究进展、未来的趋势及研究的不足;其次详细介绍了社会化媒体的内涵及特征,同时对热点发现及个性化资源推荐的相关知识进行了梳理,包括热点发现的定义、过程、规则、方法,几种基于数据挖掘的热点算法的比较,个性化推荐用户建模的相关知识以及常用的几种资源推荐算法。再次,本文在已有热点算法研究的基础上提出一种将OPTICS密度聚类算法与改进的Single-Pass算法相结合的二次聚类热点发现算法,通过实验验证发现,将密度聚类算法与增量聚类算法相结合,能够避免传统增量聚类算法自身缺陷导致的聚类结果不精确,从而实现快速有效地从社会化媒体中挖掘到当前学科领域内热点话题。最后,本文在已获取的热点的基础上,结合个性化推荐算法中基于内容的推荐算法,对传统算法进行相应的改进,提出一种即考虑了当前热点又考虑用户兴趣的推荐方法,通过实验验证,该方法对提高高校图书馆信息资源服务具有很大的促进作用。