论文部分内容阅读
随着高校档案数据量的不断增加,音频、视频等非格式化数据的大量出现,使得档案管理工作越来越复杂。而一般的信息化管理手段已经不能胜任现阶段的要求。本项目提出使用Apache中的Hadoop项目对日益增长的档案数据进行管理和分析,解决档案数据的存储、检索和分析等问题。通过HDFS来存储各种类型档案文件,MapReduce处理查询和分析任务,Hbase完成数据存储。