论文部分内容阅读
随着互联网技术的不断发展,我们正处于一个信息爆炸式增长的时代。企业作为应用互联网技术最广泛的群体,其信息增长速度更是十分惊人。在如此庞大的数据中,尤其是以电子邮件和即时通讯消息为代表的半结构化数据和以各类电子文件为代表的非结构化数据的增长速度最快。而如何高效地管理这些数据,已经成为了企业信息化部门的一项重要课题。数据归档系统使企业可以在不丢失对数据的实时访问能力的情况下将大量很少访问的历史数据从昂贵的主存储中解放出来,转存入相对廉价的设备中,有效地为企业降低了运营成本。另一方面,随着美国的萨班斯法案、中国的《基金管理公司投资管理人员管理指导意见》等一系列关于企业信息管理的法案出台,对企业有关商业数据的举证、保护和存储都提出了更高的要求。良好的归档系统能够提供安全的数据保护和高效的数据检索服务,使企业能够应对各种举证等法律要求。传统归档系统往往采用分布式架构来处理企业的大量数据,这种做法存在部署复杂,系统可靠性下降等问题。随着云计算技术的不断发展,我们逐渐意识到和传统归档系统相比,基于云计算的系统具有安全可靠、部署简单、资源利用率高等特点,基于云计算的技术来进行信息归档,能够显著提高企业用户数据归档的效率。本论文首先对数据归档系统及云计算在企业应用的现状和问题进行了分析。并在此基础上,提出了基于云计算的归档系统模型,将归档作为一种云服务对企业进行提供。然后,详细阐述了分布式文件系统和归档系统的设计机制及架构,并进行了实验和部署。最后,分析了整个系统的扩展性及一些不足之处,展望了未来的工作。