论文部分内容阅读
传统古籍尤其是韵书采用传统手工案头查询方式,不仅操作繁琐,而且准确度和可重复利用率也不高,从而导致韵书的利用率低。如今,随着计算机技术的迅猛发展,古老的汉语史研究在信息化的浪潮中也获得了新的发展机遇[1]。我们利用计算机技术对《洪武正韵》进行辅助研究,不仅能够“通过编制程序,让计算机来整理、排比、分析、归纳语料,让专家从繁琐的手工劳动中解放出来,集中精力思考,进行科学研究。”[2](P60)而且在相当程度上避免研究结果的主观性和不确定性,从而提高韵书的利用率[3]。
《洪武正韵》是研究汉语史近代音的重要文献之一,初刊本《洪武正韵》全书16卷,平、上、去三声各分为22韵,入声10韵,共76韵,其编撰原则是“壹以中原雅音为定”,基本上是从《广韵》《集韵》《礼部韵略》一贯下来的官方颁行的韵书。针对《洪武正韵》韵书的结构特点和功能需求,我们在对《洪武正韵》计算机预处理的基础上,设计适合于《洪武正韵》查询系统的流程,利用Access数据库建立了查询系统,实现《洪武正韵》小韵、韵字等信息的快速查询和管理,为汉语史研究者分析、判断、决策提供辅助依据。Access是小型的关系数据库,它具有友好的用户界面,而且Access可以运行于WindowsXP、NT等操作系统平台上,用户可以使用数据表来存储数据,同时存放有关表之间的关联信息,来减少数据重复,节省存储空间,使数据的修改更新十分快速准确。此外,Access还能显示汉语史研究中常出现的超大字符集里的字符。
一、《洪武正韵》的计算机预处理
为实现计算机辅助汉语史的研究,《洪武正韵》在制作查询系统之前,必须进行一系列的计算机预处理。
首先是《洪武正韵》电子文本校勘和录入。“文本文件的生成一般有键盘录入、扫描录入、手写录入、语音录入等几种方式。”[4](P18)由于《洪武正韵》中有许多超大字符集中的汉字,在目前的技术条件下,我们主要采用键盘录入方式。《洪武正韵》在版本选择上,主要以较早的隆庆元年衡王府厚德堂刊本为底本,参以四库本,朝鲜李朝英祖本,除此外,我们还参考近代汉语时期各种音韵著作及其相关资料,也包括中古时期的音韵著作,如《广韵》《韵略易通》《古今韵会举要》等。由于《洪武正韵》中许多繁难冷僻字只有中文超大字符集才支持,因此我们录入的电子文档使用“超大字符集”输入法。
其次,制作导入Access之前制作成Excel数据。由于Access数据库里的记录插入的新记录,一般追加在所有记录的末尾,这样不便于校勘过程中随时调整,所以,我们先在Excel工作簿中操作,再直接导入Access中进行建立数据表。在数据导入Excel工作簿之前,我们对《洪武正韵》功能需求进行分析,对其文本格式规范化,对电子文本设置层次标记,由于数据表之间的ID填充是有关联的,通过“宏”进行编程可以实现快捷、准确的填充。
二、《洪武正韵》数据库查询系统的设计
(一)设计思想
《洪武正韵》数据库查询系统设计总体包括数据结构设计、数据表关系建立、数据库查询设计、数据库窗体设计等几个方面。
数据库主要是处理结构化的语言材料,而关系数据库则是处理有关系的结构化的材料,根据《洪武正韵》韵谱的结构树形图及我们实际研究过程中的功能需求,我们的查询系统大致分为六大部分:书目信息表、声调信息表、卷目信息表、韵部信息表、小韵信息表、韵字信息表。各部分根据传统语言学研究需求可再详细划分不同的数据类型,每一类别对应一个数据表,现列出《洪武正韵》数据库查询系统六个数据表的结构,如图1所示:
图1:《洪武正韵》查询系统数据表结构图
1.各相关数据表之间通过表的主关键字“ID”建立关系进行关联。
2.在数据表的关系建立之后,根据需求建立不同的查询。
3.查询数据结果最终以子窗体加以体现:首先第一次单击按钮从初始化界面进入到查询界面,通过总体查询和分类查询分别进入第二级和第三级查询结果显示界面。
4.利用自带的宏和VB代码实现一些辅助功能,如查询结果的显示和最终结果的打印预览和打印功能等。
本系统完全利用Access2000制作,首先在前期预处理的基础上创建出数据库的一些必要对象:表、查询、窗体,并利用“宏”或者“模块”将它们之间有机链接起来,即完成整个系统的设计。
(二)查询系统设计
1.表的创建
通过上面数据结构设计,我们可以看出《洪武正韵》各表之间的关系如下:一个或多个韵字组成一个小韵,多个小韵合成一个韵部,多个韵部合成一卷,多卷合成一个调,四个调组合成整部韵书。这样《洪武正韵》数据工作簿,需要分立六个工作数据表:(1)“洪武正韵书目”数据表;(2)“洪武正韵声调”数据表;(3)“洪武正韵部”数据表;(4)洪武正韵卷目”数据表;(5)“洪武正韵小韵”数据表;(6)洪武正韵字头”。
2.关系的建立
《洪武正韵》数据库查询系统通过主键和外部主键来建立数据表之间的关系,使相关数据表之间通过相同字段内容联系起来,保证了系统参照完整性。系统构建的各相关数据表之间的关系如图2所示。
图2:相关数据表之间的关系视图
3.查询的创建
查询是数据库系统中的一个重要对象,查询能够把多个数据表中的数据抽取出来以解决问题,或者对数据完成某种操作,可以进行计算,甚至可以利用查询完成回答。在本系统中,查询担负着数据的检索、定位的重任,正是查询把数据表和数据库的其它对象串接起来。Access中查询主要通过以下几种方式实现:一种是向导创建查询,一种是设计视图,还有一种是通过在VB中嵌入SQL查询语句实现的。
我们主要使用设计视图来建立查询,这样可以根据用户的不同需求执行各种各样的操作,如更新数据库中的数据,从数据库中提取数据等。
4.窗体的创建
作为access数据库中的主要对象,窗体提供了查阅、新建、编辑和删除数据的最富弹性的方法。用户根据自己的需要设计相应的窗体,作为数据库中的数据输入的接口,借以完成数据的管理和维护功能。本系统主要有三个主窗体,其中包括初始化窗体和选择窗体和查询结果显示窗体,通过在主窗体上设计动作控件来完成相应的查询功能。
5.宏的创建
宏是Access中功能强大的对象之一,它具有独特的优点:帮助用户实现各种操作集合,达到节约时间的目的;可将系统中的各对象有机结合起来,将编程放到系统内部,可以减少没有编程基础的用户对编程的恐惧感。本系统由于功能不是很复杂,仅用到两个宏autoexec和print。
三、系统的功能及安全问题
(一)系统功能
1.进入系统
双击数据库名称“数据库查询系统”图标,便可进入系统,出现欢迎界面。
2.查询功能
单击“进入系统”按钮,进入查询主页面,在查询主界面窗口的组合列表框中便可选择您要查询的总体信息情况和分类查询指标类型。如果在组合框中没有找到您要查询的韵字或者小韵,会弹出对话框:“该数据库不存在此字”。查询窗口界面如下图:
图3:《洪武正韵》韵字查询窗口
3.显示功能
在查询主窗体上选定查询指标后,单击查询按钮,就会出现相关指标信息的查询结果显示窗体。为便于观察,结果显示窗体上利用文本框控件动态生成所要查询指标的名称。若需要打印,请点击打印按钮,想将查询结束或进行新的查询,请点击关闭按钮。
4.数据修改、输入、保存功能
在对数据库的结构进行修改时,应进行仔细的考虑。因为表是数据库的核心,它的修改将影响到整个数据库。尤其是在已设定了关系的数据库中进行修改,必须将相互关联的表同时进行修改,如果出现遗漏,将会导致出错。所以在进行数据表的改动之前,有必要对数据库系统进行备份[4]。
本数据库系统中数据的修改、输入、保存均在数据表视图中完成。通过数据表的组织与创建来完成数据的修改、输入和保存工作。全新数据表的创建和新数据的追加均要围绕初始化数据设计出发,以免破坏原有的数据组织结构和数据表之间的关系。
(二)数据库的安全
数据库的安全和存取权限是数据库系统开发必须考虑的问题。Access2000提供了设置数据库安全的两种方法:设置数据库密码和用户级安全。前者只能为打开数据库设置密码,而后者则可以限制用户访问或者更改数据库的某一部分。除此之外,我们还可以将数据库保存为MDB文件,以删除数据库中可编辑的VBA代码,用以防止他人对窗体、报表或者模块的设计进行更改[5]。
四、结语
利用《洪武正韵》查询系统不仅可以使用户或研究人员摆脱繁琐的手工操作,提高研究工作效率,还可以更加快捷准确地获取《洪武正韵》韵书的相关数据信息。本系统不但具备简便、快捷、实用的特点,还具有良好的可扩展性,有利于用户或者研究者作进一步的研究和开发,可为同类性质的不同历史时期的古籍作进一步的系统探讨。
(本文为湖北第二师范学院青年课题项目[项目编号:2010C006]。)
注 释:
[1]尉迟治平.计算机技术和汉语史研究[J].古汉语研究,2000,(3).
[2]尉迟治平.汉语信息处理和计算机辅助汉语史研究[J].语言研
究,2004,(3).
[3]黄仁瑄.《慧琳音义》的计算机处理和音系研究[D].武汉:华中
科技大学,2002.
[4]张坎,侯世国,所玉君.Access2000入门与提高[M].北京:清华
大学出版社,1999.
[5]宋海燕.如何保证Access应用的数据安全[J].华南师范大学学报,
2001,(1).
(童琴 武汉 湖北第二师范学院文学院中文系 430205)
《洪武正韵》是研究汉语史近代音的重要文献之一,初刊本《洪武正韵》全书16卷,平、上、去三声各分为22韵,入声10韵,共76韵,其编撰原则是“壹以中原雅音为定”,基本上是从《广韵》《集韵》《礼部韵略》一贯下来的官方颁行的韵书。针对《洪武正韵》韵书的结构特点和功能需求,我们在对《洪武正韵》计算机预处理的基础上,设计适合于《洪武正韵》查询系统的流程,利用Access数据库建立了查询系统,实现《洪武正韵》小韵、韵字等信息的快速查询和管理,为汉语史研究者分析、判断、决策提供辅助依据。Access是小型的关系数据库,它具有友好的用户界面,而且Access可以运行于WindowsXP、NT等操作系统平台上,用户可以使用数据表来存储数据,同时存放有关表之间的关联信息,来减少数据重复,节省存储空间,使数据的修改更新十分快速准确。此外,Access还能显示汉语史研究中常出现的超大字符集里的字符。
一、《洪武正韵》的计算机预处理
为实现计算机辅助汉语史的研究,《洪武正韵》在制作查询系统之前,必须进行一系列的计算机预处理。
首先是《洪武正韵》电子文本校勘和录入。“文本文件的生成一般有键盘录入、扫描录入、手写录入、语音录入等几种方式。”[4](P18)由于《洪武正韵》中有许多超大字符集中的汉字,在目前的技术条件下,我们主要采用键盘录入方式。《洪武正韵》在版本选择上,主要以较早的隆庆元年衡王府厚德堂刊本为底本,参以四库本,朝鲜李朝英祖本,除此外,我们还参考近代汉语时期各种音韵著作及其相关资料,也包括中古时期的音韵著作,如《广韵》《韵略易通》《古今韵会举要》等。由于《洪武正韵》中许多繁难冷僻字只有中文超大字符集才支持,因此我们录入的电子文档使用“超大字符集”输入法。
其次,制作导入Access之前制作成Excel数据。由于Access数据库里的记录插入的新记录,一般追加在所有记录的末尾,这样不便于校勘过程中随时调整,所以,我们先在Excel工作簿中操作,再直接导入Access中进行建立数据表。在数据导入Excel工作簿之前,我们对《洪武正韵》功能需求进行分析,对其文本格式规范化,对电子文本设置层次标记,由于数据表之间的ID填充是有关联的,通过“宏”进行编程可以实现快捷、准确的填充。
二、《洪武正韵》数据库查询系统的设计
(一)设计思想
《洪武正韵》数据库查询系统设计总体包括数据结构设计、数据表关系建立、数据库查询设计、数据库窗体设计等几个方面。
数据库主要是处理结构化的语言材料,而关系数据库则是处理有关系的结构化的材料,根据《洪武正韵》韵谱的结构树形图及我们实际研究过程中的功能需求,我们的查询系统大致分为六大部分:书目信息表、声调信息表、卷目信息表、韵部信息表、小韵信息表、韵字信息表。各部分根据传统语言学研究需求可再详细划分不同的数据类型,每一类别对应一个数据表,现列出《洪武正韵》数据库查询系统六个数据表的结构,如图1所示:
图1:《洪武正韵》查询系统数据表结构图
1.各相关数据表之间通过表的主关键字“ID”建立关系进行关联。
2.在数据表的关系建立之后,根据需求建立不同的查询。
3.查询数据结果最终以子窗体加以体现:首先第一次单击按钮从初始化界面进入到查询界面,通过总体查询和分类查询分别进入第二级和第三级查询结果显示界面。
4.利用自带的宏和VB代码实现一些辅助功能,如查询结果的显示和最终结果的打印预览和打印功能等。
本系统完全利用Access2000制作,首先在前期预处理的基础上创建出数据库的一些必要对象:表、查询、窗体,并利用“宏”或者“模块”将它们之间有机链接起来,即完成整个系统的设计。
(二)查询系统设计
1.表的创建
通过上面数据结构设计,我们可以看出《洪武正韵》各表之间的关系如下:一个或多个韵字组成一个小韵,多个小韵合成一个韵部,多个韵部合成一卷,多卷合成一个调,四个调组合成整部韵书。这样《洪武正韵》数据工作簿,需要分立六个工作数据表:(1)“洪武正韵书目”数据表;(2)“洪武正韵声调”数据表;(3)“洪武正韵部”数据表;(4)洪武正韵卷目”数据表;(5)“洪武正韵小韵”数据表;(6)洪武正韵字头”。
2.关系的建立
《洪武正韵》数据库查询系统通过主键和外部主键来建立数据表之间的关系,使相关数据表之间通过相同字段内容联系起来,保证了系统参照完整性。系统构建的各相关数据表之间的关系如图2所示。
图2:相关数据表之间的关系视图
3.查询的创建
查询是数据库系统中的一个重要对象,查询能够把多个数据表中的数据抽取出来以解决问题,或者对数据完成某种操作,可以进行计算,甚至可以利用查询完成回答。在本系统中,查询担负着数据的检索、定位的重任,正是查询把数据表和数据库的其它对象串接起来。Access中查询主要通过以下几种方式实现:一种是向导创建查询,一种是设计视图,还有一种是通过在VB中嵌入SQL查询语句实现的。
我们主要使用设计视图来建立查询,这样可以根据用户的不同需求执行各种各样的操作,如更新数据库中的数据,从数据库中提取数据等。
4.窗体的创建
作为access数据库中的主要对象,窗体提供了查阅、新建、编辑和删除数据的最富弹性的方法。用户根据自己的需要设计相应的窗体,作为数据库中的数据输入的接口,借以完成数据的管理和维护功能。本系统主要有三个主窗体,其中包括初始化窗体和选择窗体和查询结果显示窗体,通过在主窗体上设计动作控件来完成相应的查询功能。
5.宏的创建
宏是Access中功能强大的对象之一,它具有独特的优点:帮助用户实现各种操作集合,达到节约时间的目的;可将系统中的各对象有机结合起来,将编程放到系统内部,可以减少没有编程基础的用户对编程的恐惧感。本系统由于功能不是很复杂,仅用到两个宏autoexec和print。
三、系统的功能及安全问题
(一)系统功能
1.进入系统
双击数据库名称“数据库查询系统”图标,便可进入系统,出现欢迎界面。
2.查询功能
单击“进入系统”按钮,进入查询主页面,在查询主界面窗口的组合列表框中便可选择您要查询的总体信息情况和分类查询指标类型。如果在组合框中没有找到您要查询的韵字或者小韵,会弹出对话框:“该数据库不存在此字”。查询窗口界面如下图:
图3:《洪武正韵》韵字查询窗口
3.显示功能
在查询主窗体上选定查询指标后,单击查询按钮,就会出现相关指标信息的查询结果显示窗体。为便于观察,结果显示窗体上利用文本框控件动态生成所要查询指标的名称。若需要打印,请点击打印按钮,想将查询结束或进行新的查询,请点击关闭按钮。
4.数据修改、输入、保存功能
在对数据库的结构进行修改时,应进行仔细的考虑。因为表是数据库的核心,它的修改将影响到整个数据库。尤其是在已设定了关系的数据库中进行修改,必须将相互关联的表同时进行修改,如果出现遗漏,将会导致出错。所以在进行数据表的改动之前,有必要对数据库系统进行备份[4]。
本数据库系统中数据的修改、输入、保存均在数据表视图中完成。通过数据表的组织与创建来完成数据的修改、输入和保存工作。全新数据表的创建和新数据的追加均要围绕初始化数据设计出发,以免破坏原有的数据组织结构和数据表之间的关系。
(二)数据库的安全
数据库的安全和存取权限是数据库系统开发必须考虑的问题。Access2000提供了设置数据库安全的两种方法:设置数据库密码和用户级安全。前者只能为打开数据库设置密码,而后者则可以限制用户访问或者更改数据库的某一部分。除此之外,我们还可以将数据库保存为MDB文件,以删除数据库中可编辑的VBA代码,用以防止他人对窗体、报表或者模块的设计进行更改[5]。
四、结语
利用《洪武正韵》查询系统不仅可以使用户或研究人员摆脱繁琐的手工操作,提高研究工作效率,还可以更加快捷准确地获取《洪武正韵》韵书的相关数据信息。本系统不但具备简便、快捷、实用的特点,还具有良好的可扩展性,有利于用户或者研究者作进一步的研究和开发,可为同类性质的不同历史时期的古籍作进一步的系统探讨。
(本文为湖北第二师范学院青年课题项目[项目编号:2010C006]。)
注 释:
[1]尉迟治平.计算机技术和汉语史研究[J].古汉语研究,2000,(3).
[2]尉迟治平.汉语信息处理和计算机辅助汉语史研究[J].语言研
究,2004,(3).
[3]黄仁瑄.《慧琳音义》的计算机处理和音系研究[D].武汉:华中
科技大学,2002.
[4]张坎,侯世国,所玉君.Access2000入门与提高[M].北京:清华
大学出版社,1999.
[5]宋海燕.如何保证Access应用的数据安全[J].华南师范大学学报,
2001,(1).
(童琴 武汉 湖北第二师范学院文学院中文系 430205)