大数据背景下的中文阅读

来源 :青年文学家 | 被引量 : 0次 | 上传用户:CBN_cntjlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文以大数据为背景对中文数据库的阅读展开分析,并梳理了大数据、数据库的基本内涵,以及中文数据库的发展状况,主要以郑州大学河南文献数据为例,从其特色内容、检索途径、检索方法、功能作用等方面简要分析了中文数据库的阅读与使用。
  关键词:大数据;数据库;中文阅读
  作者简介:林冉(1992-),女,汉族,福建福州人,郑州大学文学院中国古典文献学硕士研究生二年级在读,研究方向:先秦两汉文学文献,发表论文2篇。
  [中图分类号]:G250.74 [文献标识码]:A
  [文章编号]:1002-2139(2016)-12--03
  郑州大学河南文献数据库是大数据时代的产物,该数据库中保存着河南省珍贵的历史文化资料,介绍其使用的方法有利于进一步推广该数据库,同时对致力于研究河南省的读者也具有一定的意义。
  一、大数据时代数据库建设
  (一)大数据的定义及特点
  随着电子信息技术的发展与普及,我们正生活在一个信息爆炸的大数据时代,充斥着形形色色、令人眼花缭乱的信息资讯。大数据并非产品也不是技术,只是数字化时代的一种现象[1]。关于大数据的定义,学术界尚未得出一个统一的结论。如基維百科将大数据定义为规模巨大到无法用目前的软件工具处理的巨型资料量,在相应时间内完成撷取、管理、处理后利于企业完成经营目标的资讯;再如研究机构将大数据定义为必须用新型的处理模式才能更好地洞察、决策并优化流程的巨量、多样化且高速增长的信息资产;而麦肯锡的定义则为大数据是一种数据集合,且在一定时间内无法利用传统的数据软件对其进行数据采集、存数、管理及分析[2]。由此我们可以看出,大数据的特点即数量大、种类多、运行速度快。
  (二)数据库的建设及作用
  计算机的发明与普及,使数据量不断增长,大数据背景下产生了数据管理技术,数据管理技术的发展经历了以下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段。而数据库的历史可以追溯到五十年前,当时人们利用穿孔片及磁带进行数据储存。随着人们对于数据共享的要求越来越高,传统的文件系统早已不足以满足人们的需求,因而统一管理和共享数据的数据库管理系统(DBMS)应运而生。根据数据模型的特点,数据库系统被分成网状数据库、层次数据库和关系数据库三类。本文所研究的数据库指的是在大数据时代,储存着大量信息的大型信息数据库。本文认为,数据库广泛应用于社会的各行各业,按照数据库的使用的领域,又可以将其分为金融数据库、医学数据库、政府数据库、商业数据库等。
  大数据时代,信息冗杂,若不加以分类,信息查找者便难以在大数据的世界中搜索到目标信息数据。数据库的发明与应用有效地解决了这一问题,数据库拥有分门别类处理信息数据的功能,它使纷繁复杂的数据条理化、门类化,并提供了便捷的检索途径,使信息查找者通过关键词的检索迅速匹配到他们所需的信息,极大程度上节约了人力与物力,帮助人们便捷高效地从海量信息中挖掘出有价值的信息。
  二、中文数据库发展及阅读
  信息资源的开发与利用是衡量国家综合国力的标志之一,而中文数据库建设是我国信息资源建设的主要组成部分,中文数据库的阅读对于提升我国软实力具有重要的意义。
  从国际数据库的发展来看,美国是数据库和联机检索服务的最大提供者,也是最大的市场。其数据库开发和联机检索服务一直是其信息服务业的主体,增长率最高[3]。日本、英国、德国等发达国家也同样对数据库建设投入了大量资金,企图扩大市场份额。20世纪80年代中后期,我国利用国外数据库技术开始开发国产中文数据库。1979年,我国开始引进美国国会馆MARC磁带,数据库在我国逐步推广应用,到了上世纪90年代,我国出现了全文数据库的供应商[4]。
  中文数据库建设相比较于发达国家而言,起步比较晚,数据库技术也主要是引进国外的技术。近几年来,我国更加重视中文数据库的建设,进一步加大了投入,如CNKI系列数据库、万方数据库、维普中文科技期刊数据库、中宏数据库等为代表的中文数据库的数量逐渐增多,其占中文话语市场的份额也在不断扩大,中文数据库得到了长足的发展。
  中文数据库数量的增加、涉及领域的扩大为国内用户在大数据背景下浏览各类信息提供了便捷的渠道。中文数据库的阅读改变了传统纸质期刊阅读的方式,将阅读进一步推向了数字化。一些中文数据库中收录了我国经典古籍及优秀的文化作品,中文数据库的阅读拓宽了中华灿烂文明传播的广度,使经典的传承与发扬更加便捷。在纷繁复杂的大数据时代,中文数据库的建立与发展对于国家软实力的提高具有重要意义。
  三、以郑州大学河南文献数据库为例简析中文数据库的阅读与使用
  (一)数据库简介
  郑州大学河南文献数据库是郑州大学图书馆于2004年研制开发的CALIS(中国高等教育文献保障系统)专题特色数据库项目之一,属于典型的中文数据库,其中收录了河南省诸多珍贵文献资料,共有81109条记录。该数据库收录的数据资料内容丰富、形式多样,不仅收录大量河南文献、报刊、学位论文的相关介绍,而且还收录了具有地方特色的名人介绍、名人手稿、名胜古迹图片等,涉及了方志、年鉴、文学、党史、文化艺术、社会生活、政治、军事、工运、妇女、文物考古、教育、卫生、统计资料、水利、黄河文史资料、财政金融工商税务、工业、农业等领域,对于这些珍贵资料的购买与获得均提供了联系方式。河南文献数据库的网址访问路径位于郑州大学图书馆网址首页数据资料栏目的自建数据库内,建库至今数据库总访问量已经达到541600人次。数据库以系统齐全的地方文献收藏和多角度深层次的研究,为致力于研究河南的学者提供了检索河南文献的途径与导向。
  (二)特色内容分析
  郑州大学河南文献数据库最突出的特点是收录了大量与河南相关的珍贵的文字、图片资料,拥有其他数据库所不具备的资源优势,凸显了鲜明的河南特色。数据库的特色内容包括7个板块——河南文献、旧志提要、珍稀报刊、历代名人、名胜古迹、名人手稿、特色学位论文,为有兴趣研究河南的读者提供了了解河南的良好向导。   河南文献板块中收录了与河南省相关的各个方面的文献资料,涉及了政治、经济、文化、地理等领域。数据库虽仅是为研究者提供检索的向导,未将文献全文收录其中,但提供了文献创建者、编辑者、出版者、出版时间、ISBN号、开本、地域、页码、复本、购买方式等信息,为研究者检索提供了极大的便利。
  旧志提要中涵盖了河南省各县市的地方旧志,并对版本、卷册、地区以及购买联系方式等基本信息做了简要介绍。该数据库中保存的地方旧志版本均属于明清及民国的刊本、刻本、稿本以及铅印本。旧志内容包含了河南省古代名物典章、地方性的人、事、物,为研究该市、县的学者提供了宝贵的资料。
  珍稀报刊共保存了40201份史料,该数据库介绍了作者、来源刊名、来源卷、出版地、页码、关键字、学科分类号、联系方式等基本信息。这些珍贵资料记录了不同时期在河南省发生的重大事件,内容丰富全面,若不是专门收集保存,目前在市面均很难找到,因此该数据库对于了解与研究河南省的历史具有重要的意义。
  历代名人,数据库共列举了从古至今17887位河南省名人,如著名的政治名人范蠡、李斯、岳飞等,文化名人杜甫、李商隐、干宝等,以及其他时代的名人。数据库注明了名人所属的地域、生年卒年、朝代、著作、民族等信息,数据库还专门提供了名人传记全文下载。
  名胜古迹板块共有3134处名胜古迹,按照名人故居、陵墓、古遗址、古城址、寺庙、古塔、风景区等类别进行分类,标注了创建者、所属地区、年代、来源,并对其做简要的介绍,数据库还提供图片下载,图文并茂地展示河南省人文与地理景观,有利于检索者更加直观地感受其魅力。
  名人手稿与特色学位论文。名人手稿共4092篇,收录了来自文学艺术、政治经济、宗教、传媒、农业、计算机计算、少林武术等领域的文章,这些文章均出自河南籍各界名人学者之手,为研究河南名人及河南文化思想的读者提供了宝贵资料。数据库中收录了7754篇特色学位论文,所有的特色学位论文都是以河南省作为研究对象的,涉及了众多学科专业,具有很强的学术性与实践性,对于全面地了解河南省具有一定的作用。
  (三)检索方法分析
  数据库首页设置了快速检索与高级检索两大检索方法。有利于讀者快速锁定目标文献,基本上均能满足读者的检索需求。
  快速检索属于初步基本检索,通过题名、作者、关键词途径即可进行检索,一般情况下快速检索所得到的文献数量较多,难以一步到位精确到检索者所需要的目标信息。此外,该数据库的快捷检索不支持同时输入两个以上关键词进行检索,即读者通过题名、作者、关键词三个途径进行检索时只能输入一个词,系统才能进行正常检索,否则系统将显示无纪录。因此,检索者在此数据库中进行快速检索后还需进一步筛选信息。
  高级检索相比较于快速检索而言更加智能,搜索得到的文献更加精准、范围也更小。在高级检索界面,可同时在题名、作者、关键词(主题)、地域选择框中输入信息,系统将围绕着这四项信息进行匹配。此外在高级检索中还能选择检索来源,检索者可根据自己的需求选择以整个数据库为范围,或在数据库下设的7个板块中任选其一作为检索范围。快捷检索与高级检索各有千秋,快捷检索适合于模糊查找,而高级检索则更精准地匹配到目标文献,读者可根据自己的阅读需求进行选择。
  (四)检索途径分析
  郑州大学河南文献数据库设置了多种检索途径,基本满足读者从全部、题名、作者、关键词等常用途径的检索外,还结合数据库各个板块的特色设置了其他检索途径。在河南文献板块与珍稀报刊板块中增加了出版地与学科分类号两种途径;名胜古迹检索途径增加了所属地与古迹分类;名人手稿的检索途径增加了出版社与文摘类型;旧志提要的检索途径则为题名、年代、地区;历代名人的检索途径为全部、作者、籍贯、职务、地域、关键词;特色学位论文的检索途径为题名、作者、关键词。数据库根据不同的资料类型提供个性化的检索途径,方便读者的查找与阅读使用。
  (五)作用意义分析
  郑州大学河南文献数据库作为郑州大学自建特色数据库,为广大感兴趣于研究河南的读者提供了了解河南省的重要窗口,正如郑州大学河南文献数据库网站介绍所说,它是“探索河南奥秘的文献中心,开启中原文化的一把钥匙。”中原文化悠久而灿烂,是中华文明的重要组成部分。河南文献数据库收录了大量珍贵的河南文献资料为河南文化的传承做出了贡献,为致力于研究以及有兴趣了解河南的广大社会人士提供了良好的向导,通过这个向导,读者不仅可以感受到中原文化与历史的厚重感,而且还能领略到名胜古迹的独特魅力。此外,数据库的开发与使用有利于河南省文化产业的发展,有利于各界人士增进对河南的了解及共同开发河南省丰富的文化资源,进而促进河南省文化与经济的进一步发展。
  四、结语
  随着电子信息技术的发展,当今世界已经进入了一个大数据时代,面对纷繁复杂的大数据,数据库技术的产生无疑促进了大数据的条理化与门类化,提高了阅读效率。中文数据库伴随着中文信息的快速增长,其数目不断增多,信息更加全面,市场的份额也不断扩大,为读者提供了诸多便利。河南文献数据库作为一个典型的中文数据库,反映了大数据时代中文数据库收录内容丰富、检索途径多样、检索方式灵活、检索效率高、具有鲜明中国特色等特点。同时,在大数据背景下,其为河南省灿烂文化的传播做出了一定贡献,利用好这个特色数据库进行阅读与查找河南文献对于了解与研究河南都具有重要意义。
  参考文献:
  [1]程陈.大数据挖掘分析[J].软件.2014,35(4):130-131.
  [2]葛春燕.数据挖掘技术在保险公司客户评估中的应用研究[J].软件,2013,34(1):116-118.
  [3]李莉莉.关于信息资源开发与数据库建设的思考[J].情报杂志,1998,17(5):29-30.
  [4]钟文一.我国国产全文数据库的检索阅读平台研究[J].情报杂志,2003,10(6):89-92.
其他文献
如果你不知道唐爷是何许人也,那么,我从他的两张名片来说起。  一个父亲、旅游老兵和他的两张名片  唐一波唐爷,旅游老兵,70后旅游创业者,创业公司的CEO。和无数个父亲一样,他的另一个目标是做一个称职的好父亲。  曾经在周末与唐爷相约喝咖啡,然而唐爷告诉我,他要陪他的宝贝女儿。作为“高龄”创业者,周末是他唯一能给女儿的专属时间。女儿十岁,上五年级,正是快乐成长的好时光,唐爷希望能挤出时间来陪她学习
摘 要:影片《模仿游戏》较真实而震撼地再现了“天才计算机之父”艾伦·图灵对英国历史的贡献和短暂的传奇人生。本文对影片的叙事方式、结尾处理及强烈的悲剧震撼效果进行了充分肯定,也论述了其不足之处。  关键词:《模仿游戏》;艾伦·图灵;同性恋;悲剧  [中图分类号]:J9 [文献标识码]:A  [文章编号]:1002-2139(2016)-03--01  曾听人说过改变世界的有三个“苹果”,一是夏娃亚当
摘 要:汉语中有一种常见的语言现象叫动词重叠,许多语言学家在这些方面也做过深入地研究,但是大家的有些观点存在不一致的现象。本文从现代汉语词典(第五版)中截取20个词进行分析,并得出以下结论:动词能否重叠,往往跟语体、动词自身性质等密切相关;单音节动词在一般情况下能够重叠的数量多,动宾结构表现为半重叠形式;动词在表示还没有发生的动作时,重叠范围较大。  关键词:动词;语体;重叠;不重叠;单音节  [
摘 要:近年来,跨学科间的界面研究发展迅速,其他学科研究对翻译学科发展也起到了较大的推进作用。文章以王尔德的戏剧《不可儿戏》的译本为例,以戏剧翻译的舞台性,即时性和无注性的特点为中心,在认知语言学中的意象图式视角下,通过意象传递,意象转换和意象再造三种方法对戏剧翻译中不可避免的文化合流现象进行解释。  关键词:戏剧翻译;意象图式;《不可儿戏》;The Importance of Being Ern
摘 要:21世纪之初电影《楚门的世界》将娱乐媒体推到风口浪尖,大众传媒文化在一时间引发人们思考,在电视媒体下赤裸裸的监视他人的人生,是不是应该被抨击,作为娱乐的消费者,我们应不应该消费他人的生活?然而随着互联网时代的高速发展,新兴的职业“网络主播”也在瞬间遍地开花,与此同时大众传媒文化也面临着新的考验,当人们再次进行消费,观看“网络主播”的直播时,我们也该拥有自己的辨识能力。  关键词:大众传媒文
摘 要:《等待》以中国文化大革命时期为大的时代背景,故事在等待中开始又在等待中结束。平凡人因追求自由而历经的现实摧残和精神折磨是小说《等待》最精彩的一笔。男主人公孔林在追求真实自我过程中的优柔寡断导致了他悲剧的人生。《自由生活》中主人公面对生活的挑战和困难却能通过自己的顽强奋斗在美国寻求新的生活。一家人对生活充满了希望。通过精神分析法解读两篇小说中的男主人公对待生活的不同态度,引发我们的深刻思考,
摘 要:张爱玲的作品中始终萦绕着家庭化的意象氛围,她由对小家的私语,折射形成了属于大社会的大家,这种小家与大家描写的叠合与变形让我们看到了她作品中强调的生命的原始性。  关键词:家的易碎与易凉;变态心理;社会悲凉  作者简介:樊宇航(1992-),女,汉族,黑龙江佳木斯市人,海南师范大学文学院学科教学(语文)专业语文学科教学硕士,研究方向:学科语文教学。  [中图分类号]:I206 [文献标识码]
摘 要:国内外学者对美国作家纳撒尼尔·霍桑(Nathaniel Hawthorne,1804—1864)的《红字》等长篇小说的研究数不胜数,与之相比,学界对其33篇短篇小说的关注则远为不够。  关键词:霍桑;威克菲尔德;孤独和异化  作者简介:陈晨(1989-),女,汉族,新疆伊宁市人,文学硕士,伊犁师范学院人文学院比较文学与世界文学专业,研究方向:英美文学。  [中图分类号]:I106 [文献标
1997年,杨宏初到铁旅,之前做财务工作的她并非旅游专业科班出身,眨眼间十八个春秋已过,儿子都已经成了风华正茂的大学生,现在旅游事业对她来说已经成了最最重要的生活组成部分。  家人眼中的杨宏温柔贤惠,同事眼中的杨姐和蔼可亲,领导眼中的杨宏耐心细致,同行眼中的杨宏专业敬业。十余年的专列中心工作让她感触良多收获颇丰,陕西金马旅游有限公司总经理陈文胜曾这样评价她:“组织协调能力、耐心的工作态度、高度的责
摘 要:《坚硬如水》是作家阎连科的代表作之一。主要表现的是革命时期的情感纠缠。在这部文学作品当中,阎连科融入了自己对于“超现实主义”的看法和理解,并得到很多名家的认可。他的作品在现实主义的土壤中孕育扎根,通过荒诞、奇特、超常的超现实主义手法来表现自己的现实主义的思想,用超现实手法对现实社会一些方面进行强烈批判,是对乡土中国的另类书写。作者在文本中努力构建隐含作者的同时,也在改变着隐含作者、叙述者、