档案工作中大数据框架构建及应用思考

来源 :科学与财富 | 被引量 : 0次 | 上传用户:lygzzm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:档案工作是当下时代发展的重点建设工作,并且在当今时代的经济全球化形式的渲染下,我国的经济建设得到了全方位的革新因此人们在生活质量随经济而得到全面提升的同时,也对自身的生活水平有了全新的要求,所以人们在各领域的需求观念也就有了实质性的变化,在档案工作这一与人们有着千丝万缕联系的体系性建设中也不例外,因此对于档案工作的建设细节来说,迫切需要将新时代发展进程中的数据以及科技化因素融于其中。因此本文在这一基础上主要分析和研究了档案工作中大数据框架构建及与之相关的应用性思考,以期为相关建设体系的开展提供一定的理论性借鉴。
  关键词:档案工作;大数据框架;构建;应用思考
  档案与我们的生活息息相关,并且我们的生活也离不开档案的建设性规划,因此,我们需要在此基础上进一步完善档案工作的相关建设项目,进而使我国档案体系的容纳力以及规划性都得到全方位的提升与发展。而在当今大数据的时代特色下,相应的诸如档案工作这类系统化的工作体系也都要或多或少地融入这一体系中,进而全面提升自身的工作建设思路,因此对于档案工作体系内部的大数据框架的建设也就显得尤为重要,因此我们需要对大数据体系展开较为全面而细致的了解,进而全面体提升档案工作的实际发展水平。
  1 档案资源的大数据特征
  1.1 种类繁多
  档案资源以文本类为主,还有大量的音视频档案、照片图片档案、图纸、凭证档案、地理信息、网络日志等,都是非结构化数据,描述这些档案资源的元数据又是结构化数据。海量结构化数据与非结构化数据的混合正是传统数据处理难以解决的问题,符合大数据的多样性特征。
  1.2 价值密度与价值成反比
  档案留存着社会的历史记忆,具有很高的历史价值。然而对当前应用来说,海量档案信息,每次可能利用的数据非常少,存在着价值密度低的特点。如视频,连续不间断摄制过程中,可能有用的数据仅仅有一两秒。这些档案信息蕴含着巨大潜能,需要人员、流程与技术的密切配合,方能将其转化为更大的真正价值。
  1.3 对处理速度要求较高
  大数据要求实时或近乎实时的处理速度,这对企事业单位来说没问题,对于国家档案馆来说好像要求过高,其实不然。传统档案利用方式是被动等待用户来查找原始信息,给社会留下“故纸堆”印象。如果改被动服务为及时、准确的主动服务,这种主动服务不仅提供档案原始信息,还应提供BI、预测分析、内容分析、辅助决策分析等。
  2 档案工作中大数据框架的具体应用
  2.1 相应平台的搭建
  大数据档案工作体系的建设在理论层面具备着十分充足的可行性,当在这一建设体系的具体实施层面依旧因实施条件的不足而潜藏着一定程度的阻碍性瑕疵,所以其具体的实施环节依旧存在着一定的执行难度,。因此需要经过全方位的权衡才能够确切地进行大数据档案工作的开展,而实际的权衡性环节需要结合具体的档案数据、相关技术的实际应用方法以及较为成熟化的实施机制这三点来进行实际的方案策划。而同时这三点也是大数据档案工作体系想进行较为成功的发展所必须具备的基础性要素。档案部门长期以来利用思想是提供原始信息的被动查询,还谈不上迫切且明确的大数据研究需求,即使在企事业单位,档案部门也很难做到主动提供服务,利用好大数据,依然需要敏锐的洞察和创新的思维,这是档案部门比较欠缺的。一定的技术积累与成熟度对于档案部门目前更是困难。综合上述分析,大数据目前在我国档案部门开展有相当大的难度。如果依靠档案部门自己,目前几乎是不可行的。但并不表示面对大数据,档案部门无所作为,可以做好迎接大数据的准备工作,同时借助外力开展试点工作。
  2.2 服务观念的转变
  档案部门作为一个服务部门,其服务态度的确立是这一部门想要取得发展性建设的必要保障,而同时态度问题也是服务类行业尤为重要的执行要素,因此在档案部门的大数据框及体系建设的环节也就要对此尤为注意。但是大多数的档案部门所持的服务观念以及对服务这一理论的理解依旧停留在传统的服务理论上,因此也就会一直延续传统服务行业的弊端,即服务者对被服务者持一种被动的等待态度,而且其实际的服务内容依旧也是以对档案信息的单纯性提供为主。随着档案信息化工作的开展,档案目录、部分档案全文经数字化后上网供利用者浏览,这是主动服务思想的体现。一些档案部门也在尝试开展进一步的主动服务工作, 面对大数据,这种转变尚不够。大数据数据量大、查询分析复杂,更重要的是精准把握利用者的需求。然而利用者很多时候并不知道准确的需求,需要档案管理人员主动深入了解业务,明确需求,准备相应数据,尤其对企事业单位档案部门更应该如此。
  2.3 档案质量的提升
  档案质量的提升也是档案大数据框架构建体系建设的必然性要素,而档案质量的提升其首先必然是先实现档案数量的提升,进而在此基础上由档案馆为基点,开展数字化档案网络体系的构建,进而实现其馆内档案的全部数字化,然后让这一批数字化的档案能够集结到统一档案数据库中,再经过对数据库的集中性建设后借助一定的共享性平台分布机制从而实现档案网络的构建,针对那些不全的档案信息进行二次修正性录入,并在此基础上实现对已录入网络的电子档案的全方位管理。由于与载体的不可分离,同一份传统档案可能在多个全宗或立档单位都存在,在大数据处理前需要查重,以免增加超级计算机或服务器集群的负担。查重的方法是利用档案目录。各档案部门基本都已建设自己馆藏的档案条目,先把条目上传,根据条目比对档案的重复性,将结果反馈给相应档案部门。以一个档案部门为主进行数字化,其他部门或下载拷贝或通过链接关联相应档案。
  2.4 云服务的实现
  大数据的基础是云计算,同时档案信息资源的整合也应该建立在云计算基础之上,可以考虑建设全国或区域性的公有云,实现全国或区域内档案条目的集中与共享,实现查重档案的存放与共享,甚至可以实现区域内所有电子文件、数字档案的存储,下级档案部门保留档案链接地址即可。这样的前提是访问公有云是高速网络。公有云下,区域内档案部门可以建设自己的私有云。档案云资源的建设使得大数据平台有了强有力的数据支撑。
  结束语
  总而言之,档案的大数据框架构建体系的建设以及具体应用体系的构建对于我国的信息化建设是十分有益的,其能将档案以数字的形式较为集中地规划到一处,并在此基础上,进一步来完善实际的档案数据库的确立,并对这一数据库进行较为稳妥地管理,这样档案的搜索机制的运行就无需通过冗杂的人力来实现,仅需通过数据库的调动就能够更为高效。迅捷地实现。因此,这一体系的建设性开展与实际的应用能为我国的相关信息化建设带去更值得借鉴的体系架构,进而在此基础上我国能够实现相应数字工程体系的全方位构建。
  参考文献
  [1]刘国华,李泽锋.档案工作中大数据框架构建及应用思考[J].档案管理,2014.
  [2]滕春娥.大数据环境下档案工作转型研究[J].北京档案,2015.
  [3]邹华英.试论大数据时代的档案工作[J].档案与建设,2013.
  [4]兰祝刚,惠英,李刚.大数据时代下的档案工作[J].中国档案,2013.
其他文献
摘 要:将近两年的加息预期终于成真,时间超长的加息预期使得其他国家早就开始为此着手准备,然而,美联储最终选择加息,无论加息数值的高低,凭借美国在世界金融地位,都将对世界经济带来巨大的影响,我国作为一个新兴的市场化国家,必须充分防范美联储加息对中国造成的负面影响,并且充分利用其加息可能带来的正面影响。  关键词:美联储;加息周期;经济泡沫;热钱  针对我国金融市场,美联储加息产生的影响是多方面的,其
期刊
摘 要:当今社会室内设计對正是一个发展机遇,其合理性、严肃性、效果、舒适度、美观情况又有很多的探讨之处,空间要素。空间的合理化并给人们以美的感受是设计基本的任务。要勇于探索时代、技术赋于空间的新形象,不要拘泥于过去形成的空间形象。  关键词:室内设计;装饰;要素;市场  1.室内装饰设计要素  空间要素:空间合理化并给人们以美的感受是设计的基本任务,我们要勇于探索时代技术赋于空间的新形象,不要拘泥
期刊
摘 要:随着信息技术的不断发展,网络应用广泛,在社会的各个领域得到推广,但是,计算机在给人们带来便利的同时,也给各个行业的信息管理的系统安全性带来隐患和问题,需要引起高度的重视,形成有效的对策。  关键词:计算机;信息管理系统;安全;对策  前言:计算机信息系统的发展为整个社会带来新的契机,但是,立足信 息管理的自身特征,计算机信息管理系统能够进行有效的实时追踪,在很大程度上提高工作效率,达到强大
期刊
摘 要:随着科技发展,博物馆在保持曾经传统陈列展览形式的同时,为了吸引更多观众到博物馆驻足参观,与观众产生互动性,以便更好地弘扬传播文化知识,都纷纷应用起新媒体技术。本文则重点介绍了信息时代下的博物馆。  关键词:信息时代;博物馆;新媒体技术  博物馆被认为是收藏、保护、研究、展示人类活动和自然环境的见证者,其不仅具有着阐释过去和现实、探索未来的功能,也承担着在收集藏品的同时使其用于研究并传播研究
期刊
摘 要:当前,我国社会主义市场经济体制还不健全,多层次的资本市场体系和金融体系还不完善,社保基金投资运营的外部条件还不太成熟,很多方面尚处于探索阶段,社保基金的收缴及管理也存在一些问题,本文从当前存在的问题出发,对提升社保基金收缴及管理水平的对策措施进行了探究。  关键词:社保基金;收缴管理;对策措施  社保基金主要包括基本医疗保险基金、基本养老保险基金、失业保险基金等,是社会保险体系的物质基础,
期刊
摘 要:不锈钢复合板具有较低的成本与良好的综合性能优势深受企业的喜爱,在石化行业和食品行业广泛得以应用。焊接是不锈钢复合板最主要的加工方法,本文重点探讨的其焊接工艺要点、常见缺陷及处理办法。  关键词:不锈钢复合板;焊接工艺;焊接缺陷  1前言  近年来,材料科学技术突飞猛进,新材料新技术如雨后春笋般出现,不锈钢复合板不但具有不锈钢材料的耐腐蚀、高强度,而且兼顾碳钢的低成本和良好加工性能,经济效果
期刊
摘 要:当前,计算机网络技术快速发展,技术水平逐渐提升,计算机网络的普及与发展使其已经广泛的存在于人们的日常生活和生产中,并不断对人们的生产生活带来巨大的影响,在计算机网络给人们的带来娱乐、休闲、便捷的同时,计算机网络安全问题逐渐受到人们的关注和重视。要促进计算机网络安全,提高其可靠性,就需要能够有效地控制计算机病毒、黑客等,保证计算机数据能够安全传播。本文就提升计算机网络可靠性进行分析和研究。 
期刊
摘 要:防水透湿织物做为功能性面料的應用与开发是服装面料未来主流的发展方向。防水性、透湿性是防水透湿织物的两个主要功能,也是衡量防水透湿织物功能性的两个主要方面。目前,各研究机构和质检部门一般都采取防水性、透湿性分别测试的方法来评价防水透湿织物的防水、透湿性能。  关键词:织物;防水透湿;性能  1 防水透湿织物  防水透湿织物也称"可呼吸织物",是一种集防水、透湿等功能为一体,防护性和舒适性有机
期刊
摘 要:国内变电站刀闸、主变压器、电压互感器等室外设备检修施工时,安全带无法真正实现高挂低用或者悬挂器在使用中无法保证作业人员人身安全。针对此种状况,根据变电站设备检修的特点,本文研制一种重量轻、体积小、安装简便、施工人员活动范围大,达到安全带高挂低用要求的安全带悬挂装置。此装置提高了现场作业人员的工作效率和安全系数,在建筑施工、电力线路检修、施工等高空作业中均适用。  关键词:变电站;高空作业;
期刊
摘 要:电力行业在发展过程中不断验证着电费核算在企业发展中产生的重要意义。作为一项支持经济发展的重要事业,电力企业在不断进步中,形成了多种多样的电费核算管理模式,集约化电费核算就是其中一种。本文简单论述了集约化电费核算管理模式的核心和做法,以供参考。  关键词:大营销;集约化;电费核算;管理模式  电费核算是整个电费结算业务的核心工作。传统的核算模式需要大量的人力物力支持,浪费时间且不能保证其精确
期刊