基于Hadoop平台的图书馆读者兴趣分析与导向系统模型的建立

来源 :长春工业大学 | 被引量 : 0次 | 上传用户：hlyhky

【摘要】

：

近年来,特别是党的十八大以来,在创新驱动国家战略的引领下,在大众创业,万众创新的大时代背景下,互联网+高校信息化管理成为了炙手可热的话题。作为学校信息数据量巨大的部门

【作者】

：

于红蕾

【机构】

：

长春工业大学

【出处】

：

长春工业大学

【发表日期】

：

2017年期

【关键词】

：

大数据 Hadoop C#语言读者兴趣分析用户导向推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,特别是党的十八大以来,在创新驱动国家战略的引领下,在大众创业,万众创新的大时代背景下,互联网+高校信息化管理成为了炙手可热的话题。作为学校信息数据量巨大的部门——图书馆,随着移动网络、大数据、云计算以及物联网等新兴技术的逐渐成熟和高校对图书馆信息化的日益重视,已经对越来越多的图书资源实现了信息化管理,并且使其呈现出了功能多样化的百花齐放的局面。广大师生在图书馆检索查阅过程中会产生非常大的数据量,这些数据正是我们对读者的阅读和检索兴趣进行深入分析的依据。值得注意的是,读者的检索多样化和读者兴趣分析及图书应用推荐智能化需求也为图书馆带来了巨大的挑战:一方面,单一的服务器外加磁盘阵列架构的图书馆智能化硬件设施已无法适应大量的数据检索分析及存储的需要,并且,以上硬件存在成本较高和难以适应大数据时代需求的缺点;另一方面,当前对高校的图书馆借阅流通数据的分析方法仍旧停留在对各种单一指标对象的分析上,分析得不够全面;最后,现行的读者兴趣分析只是得出了一个统计结果,而不是能将统计结果进一步转化为对学校图书馆如采购等其他工作产生直观指导的数据。为解决以上问题,通过对长春某大学及其周边部分省属高校图书馆进行数据分析与实地调研,结合大数据理论,结合导师的研究方向和相关横向课题,在深入研究Hadoop大数据技术的基础上,建立兴趣分析和导向模型可以对高校图书馆信息化建设的研究起到一定的借鉴作用。本文主要在以下四方面展开研究:一是将Hadoop大数据技术与C#语言数据分析技术应用于读者兴趣分析与导向分析工作中,同时为了解决大数据存储与运算的高成本问题,本文选择了成本较低的Microsoft Azurez作为服务器群,用来构建Hadoop数据平台;二是利用NoSQL分布式数据库和HBase数据库对图书馆读者借阅检索日志(图书电子资源访问来源)进行分析,通过日志分析,实现了对图书馆电子资源的使用信息进行监控、优化;三是通过对读者的文献借阅的历史数据进行挖掘,构建文献推荐模型框架;第四,将文献推荐模型框架生成的图书推荐列表进行转化,最终为采编部生成采购清单。本论文实现了以下三个方面的创新:一是将现流行的Hadoop大数据分析技术引入了较为传统的高校图书馆读者兴趣分析与导向工作中,实现了在廉价的计算机上构建文献借阅分析集群平台,充分利用微软的云平台,使海量文献借阅信息的分布式存储问题迎刃而解。二是在数据分析方面,将C#编程语言引入Hadoop框架,为兴趣分析与导向模型的建立提供了高效、直观的数据分析方案,把读者的借阅历史数据进行大数据分析与比对,最终实现针对读者的个性化推荐,进而为图书馆的馆藏图书建设、馆内图书资源结构调整提供强有力的决策支持。第三是实现了个性化推荐图书,为图书馆的图书采购部采购图书提供参考。

其他文献

面向伪装评估的场景生成技术与系统

随着计算机科学技术的发展,图形图像处理和虚拟现实技术得到了广泛的应用。同时,在现代化军事战争中,战争场景往往是复杂多变,对于军事场景的准确绘制能够使部队有效的掌握战

学位

伪装场景全景图三维地形SIFT

微博平台的热门话题检测

本文针对在微博平台检测热门话题这个问题进行了算法研究。借鉴最邻近结点算法的思路,我们提出针对时变数据的潜在信号源模型分类模型,用训练样例作为潜在信号源的代理,通过

学位

微博热门话题时变数据分类

加密数据库关键词快速检索的方法研究

随着云计算技术的发展,云数据库服务成为数据远程存储和处理的主要方式,它具有按需付费、按需扩展、高可用性和存储整合优势。通过云数据库服务商管理云端数据库可获得数据备

学位

云数据库密文检索Bloom过滤器自定义函数

基于LXC的PaaS云中支持QoS的自适应部署机制研究

PaaS(Platform as a Service)云平台是一个由硬件基础设施与软件系统构成的、分布式的计算机集群系统。用户可以使用PaaS云平台上配置的资源开发和部署应用服务程序,并管理应

学位

PaaSLXC虚拟化自适应部署节点选择算法负载均衡

基于链接关系的有向加权复杂网络关键节点识别技术研究

复杂网络作为复杂性学科中炙手可热的研究课题正受到越来越多研究者的关注,其基本理论已经渗入到各个学科和领域当中,作为该项研究重要分支的复杂网络关键节点识别技术,既具

学位

有向加权关键节点DWNodeRank初始向量幂法迭代

基于分治重组思想的人际网络行为数据的聚类可视分析

在当下数据大爆炸的时代,如何有效的处理大规模数据一直是工业界和学术界研究的热点。本文针对大规模数据采用基于分而治之的思想进行聚类可视分析,结果表明分而治之对处理大

学位

分治组合聚类分析可视化可视分析

云计算中外包存储数据完整性审计的研究

云存储的灵活性和即用即付的存储服务方式,使其受到广泛欢迎。然而,存储在云端的数据可能会因为软/硬件故障或者人为失误等原因造成丢失或者损坏,因此,验证存储在云端数据的

学位

云存储数据完整性审计私钥恢复数据隐私批审计

基于RBF神经网络的时间序列预测技术的研究——以铜陵市、池州市气象数据为例

在科学技术突飞猛进的时代，人们对气象预测精确性的要求越来越高。这不仅仅关系到农业的发展，还关系到人们的衣食出行以及政府提前做好对恶劣天气的防控措施等。与人类生存息息

学位

时间序列RBF神经网络气象数据预测技术

基于关联分析的Web服务匹配策略研究

Web服务以其松散耦合、语言无关、平台独立等特点已经成为Internet计算环境下信息、服务和业务能力的主要开放与提供形式。业务开发和使用者如何在众多的资源中快速、准确地

学位

Web服务服务匹配语义关联匹配度OWL-S语义关联图

吴方法的并行化研究与实现

作为中国数学机械化的里程碑,吴方法在科学技术和应用工程领域中有着极为广泛的应用价值。随着吴方法应用范围日渐拓宽,其所要处理的应用问题也日趋复杂。对于这些应用问题来

学位

特征列并行计算多粒度一体化研究

基于Hadoop平台的图书馆读者兴趣分析与导向系统模型的建立

其他学术论文