地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例

来源 :清史研究 | 被引量 : 0次 | 上传用户:jacklong1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
历史文献数据库可区分为数字化、数据化、文本挖掘三种不同形态,迄今多数中文历史文献数据库实现了数字化功能,部分地实现数据化功能,而能够实现文本挖掘功能的则十分少见。数字化是将文献的物理形态转化为电子形态,数据化是将文献转化为可量化分析的数据,编制元数据是主要方法。文本发掘是在此基础上开发文本分析工具。《中国地方历史文献数据库》以文献学研究为基础,建立特定的元数据结构,提供交叉导航、数据统计等多种功能,这些功能不仅可以帮助研究者找到自己的所需文献,更可能帮助研究者发现新的研究议题。史学研究中,数据库有必要被视作一种新的文献形态,建立针对性的文献学方法论。
其他文献
要有效的管理企业,需要对企业的风险做出正确的评价,合理地判断财务风险对企业管理者而言至关重要。本文运用层次分析法,对21个财务关键指标赋予权重,构建了一套三层次四维度
数据的共享开发与应用是时代的重要课题,大数据智能以人工智能为技术条件对企业的创新与发展起着不可替代的作用。员工培训是企业发展的催化剂,利用大数据智能创新培训方式,
骆驼蓬(Peganum harmala L.)系蒺藜科(Zygophyllaceae)植物,是维吾尔、蒙古族民间沿用已久的习用药材,已被列入维吾尔药卫生部药品标准。新疆蕴藏着极其丰富的天然药材资源。骆驼蓬
目的比较放化疗同步和序贯治疗中晚期鼻咽癌的疗效和毒副反应。方法 80例患者随机分成同步放化疗组(同步组)与先放疗后化疗组(序贯组),每组40例。采用多西他赛(TXT)+顺铂(DDP
本文选取我国2014年~2018年A股上市公司为样本,实证研究内部控制质量、分析师关注与企业债务融资约束之间的关系。结果表明企业内控质量和分析师关注均与其债务融资期限为显
利用2002-2016年我国27个工业产业的面板数据,探究全球生产网络下服务内容嵌入方式对劳动生产率的影响。在我国制造业服务转型过程中,不同类型行业中服务内容嵌入结果不同,明
随着我国社会经济的不断发展和科技水平的不断提升,信息化为社会生产生活做出了重要贡献。在当前信息化环境下,信息技术的应用对于企业发展有着重要的意义,企业在进行生产的
21世纪是信息化的时代,科学、技术的发展速度远超人们的想象,信息传播越来越快,在这个高科技、高效率的互联网时代,信息传递的媒介已经不局限于书刊、杂志等实体性介体,越来