论文部分内容阅读
随着大数据时代的发展,利用信息化技术实时监控学校图书馆的资源,以让人掌控学校图书馆情况是研究的主要目的。研究方法是通过Python爬虫技术,利用Lxml库爬取图书馆中的信息,接着将爬取出来的信息进行数据清洗,取出有效信息,放入Hadoop平台进行存放,最后再利用Flask框架以及数据分析及可视化技术将信息以一种直观可视的方式展现在网页上。