基于温病古籍知识概念语义网络构建研究

被引量 : 13次 | 上传用户:hubaonian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
温病文献是全部中医古文献中的一个重要门类,根据著录统计,存世的此类文献多达400余种。中医古代温病文献主要记载了包含大量现代医学范畴中的急性和烈性传染性疾病的病因、病机、治法和方药等,长期以来,一直是中医认识和防治传染性疾病所依赖的知识资源。当前,由于自然环境恶化和化学类药物的使用导致疾病谱的改变,新的重大传染性疾病不期而至。迄今为止,人们对新发的传染性疾病的发生发展规律以及有效地预防和治疗等尚缺乏认识,我国温病文献中所蕴藏的宝贵知识财富尚有待挖掘。历史上不间断的文献整理工作实则是一种资源开发的方式,现代人对这种科技文化资源的开发既要延续古人的经验和方法,又要推陈出新,对传统文献资源进行创造性的研究开发。古籍数字化必须遵循古籍整理的基本原则,懂得学术研究的基本思维过程,掌握学术研究处理文献的方式。该方式往往是突破其原有结构,将原文献划分为若干基本单位,提取其中指向内部含义的关键词,依照它们的属性进行排序、筛选、统计和分类,比较相关文献中的关键词,寻求他们之间的相关性。这正是电子媒体需要继承的重要方法,为此我们必须将隐藏于学者大脑中的经验和智慧加以总结,建立模型和序列,然后再以这些模型和序例为准标引古籍文本,使之完成经验到知识的转化,建立人文学术研究的科学内核,有效积累和传播人类知识,让每次学术研究行为都从前人的终点开始。古籍是为学术研究服务的,数字古籍也不例外。古籍数字化必须全面借鉴以往的学术成果,学者对于应用的要求是古籍数字化的起点。就其本质而言,学术研究的应用要求乃是“知识发现”。所谓知识发现(Knowledge Discovery in Database,简称KDD),又称数据挖掘技术,是指从大量数据中提取出可信的、新颖的、有效的并易于理解的知识的高级处理过程。它已广泛应用于许多领域。我们相信,数据挖掘技术运用于中医药研究领域,必将创造出更卓越的业绩。在工作实践中,认识到古籍数字化是传统古籍整理在当代的延续与发展。古籍数字化工作通过对古籍知识的解析加工,把传统古籍整理的方法与数字化技术结合起来,创造出了不同于一般古籍数据库的古籍知识库。近些年研究提出的“基于知识元的中医古籍计算机知识表示方法”,在古籍数字化实践中已经达到实用化程度,在对古籍进行解析加工基础上建立的知识库,实现了基于内容的检索,并在一定程度上实现了对知识的挖掘,为广大中医药工作者更便捷地从古籍中获取知识建立了一个平台。本文主要利用信息科学技术实现对知识的挖掘、获取,开展温病古籍的知识挖掘研究,构建温病的病、证、症、理、法、方、药本体,形成以温病疾病为核心,其他类型本体和疾病之间的关系为主的一种网状关系,为中医临床、科研和政府决策提供真实、快捷的知识服务。本文的研究内容有以下几个方面:(1)对知识表示、国内外概念语义网络构建的相关知识以及研究现状进行调研分析知识是经过整序、提炼的信息,是人们对事物产生、存在、发展变化规律的认识,是人类发现、发明与创造的成果,反映的是人类对客观事物的普遍认识和科学评价,具有相对正确性,不确定性,可表示性、可利用性。根据知识的范围来看医学知识就是领域知识即专业性知识。知识表示是用一些约定的符号将知识编码成计算机可以接受的数据结构,以实现计算机自动知识处理和问题求解。知识表示方法主要有:一阶谓词逻辑、产生式知识表示、语义网络、框架理论、面向对象知识表示法、本体、程序知识表示法,对上述方法的特点进行详细分析后可以看出:语义网络不仅可以表示实体的结构、属性以及实体间的联系,还可以通过相应地有向边(弧)推导出与某个实体相关的事实、特征、关系,能将事物的属性以及事物间的各种语义联系显式地表示出来,以便于对层次间继承性质的推理演绎。在古籍知识相关表示研究中发现古籍的知识结构主要有聚类现象、模块现象、树状结构、知识关联、隐含的知识命题等。古籍知识表示关键问题在于在中医学中资料的收集、分类、加工、检索、统计和推理是专家们进行学术研究的必要手段和重要方法,多少年来,学者们在大量的文献资料堆中收集、查找、考证资料,进行着繁重的、艰苦的劳动,这种传统的研究方式,劳动强度大、速度慢、效率低、质量差。长期以来,计算机在中医古籍数字化领域的应用得不到深入发展,其主要原因是缺少计算机对古籍的知识表示方法。而古籍知识表示要求除了需要支撑中医古籍知识等可以引入知识后的智能处理外,更需要实现对古籍知识获取、处理、分析、应用等方面知识的描述,以实现古籍知识的共享,促进温病古籍知识的应用。通过文献调研发现目前主要应用的古籍计算机知识表示方法有:“基于知识元的中医古籍计算机知识表示方法”该方法主要特点有:基于知识元的知识解析具有信息的二重性;基于知识元知识表示方法的知识解析,最终形成的是结构化文档;所有实义词的意义都可以分解成一些语义成分(Sense Components),也称为语义特征(Semantic Features),属于同一语义场的一组词可以用特征矩阵来表示,每个矩阵可以表示一个概念。结合上述研究分析,进行古籍知识的表示建模研究可以选用语义网络表示法。之所以选用该方法,主要是看重了它具有以下的优点:语义网络提供了一般化的简单方法,语义网络着重强调事物间的语义关系;语义网络具有广泛的表示范围和强大的表示能力;语义网络是一种结构化的表示方法,澄清了古籍知识结构,避免了重复知识分析,使知识共享成为可能。(2)对温病古籍知识体系的特点的分析研究知识按形式分为显性知识和缄默知识。温病古籍知识形式上属于缄默知识。温病古籍知识是一种只可意会不可言传的知识,是一种经常使用却又不能通过语言文字符号予以清晰表达或直接传递的知识。如对病证的辨证分析知识,这种知识即是所谓的“行动中的知识”,或者“内在于行动中的知识”,是存储于人们头脑中的属于个人经验、诀窍、灵感的那部分知识,常隐含于人的行动之中,属难以量化处理的隐性知识。对知识的表达而言,行动是和语言同样根本的表达方式。温病古籍部分知识属于缄默知识,是难以量化处理的隐性知识,其本体构建有其特殊性。从知识工程的角度来说,温病古籍知识本体论指的是一个温病古籍本体结构以及对温病古籍概念的本体知识描述。在这里本体知识既可以在概念层次上进行描述,也可以在语言层次上进行描述。它包含了概念的所有相关知识,知识必须与温病古籍领域相符合,又要完整地和全面地认识概念域,对隐式的或不确定的内容进行形式刻画。对温病古籍知识体系的探讨可以追溯到《黄帝内经》,直到明代末,才真正出现了第一部温病学的专著《温疫论》,此后叶桂《温热论》等书问世,形成了以卫气营血与三焦辨证为核心的辨治理论,从而使温病学脱颖而出,成为一门独立的学科。明末吴又可《温疫论》开创的疫性温病学说,继之者有郑重光、戴天章、杨栗山、刘奎、余霖等;由清初叶天士《温热论》开创的四时温病学说,宗之者有薛雪、吴鞠通、王孟英等,使温病学得到了很大的发展,温病学知识体系更加完善和独立。(3)对温病古籍知识表示方法的分析研究所选温病古籍力求全面反映该时期与温病相关的主要内容。仔细分析温病古籍知识源其基本的知识对象主要概括如下:疾病、病证、症状、脏腑、百骸、季节、药物、处方、治则治法、医籍、医家。在温病古籍知识本体中,核心的知识就是关于疾病的知识。疾病是一个最基本的温病古籍概念,根据温病古籍学科的范畴,可分为病证属性类、症状属性类、脏腑属性类、百骸属性类、季节属性类、药物属性类、处方属性类、治则治法属性类、医籍属性类、医家属性类。温病疾病类所使用到的属性之间存在固有的关系,疾病的属性及关系本身也可形成一个本体体系,称为疾病属性类。这个本体不含有任何实例,只能由病证类来实现它,在这个属性本体中反映的类别知识也是疾病类的一部分。温病古籍本体中定义了一些关系,这些关系将温病古籍中的概念与概念连接在一起,具有很重要作用。温病古籍本体中若干典型关系如等同关系、等级关系、相关关系等。在对知识库的知识添加过程中,常见的语义关系有如下几类:imply (蕴涵)、compare(比较)、similar (相似)、relation (关系)、belong (属于)、object (对象)、logic (逻辑)action (行为)、be(是)、have(有)、position (位置)quality (质量)、attribute (属性)、property (’性质)、degree (程度)、exception (除外)等,为了上述的语义关系的描述,可对关系类型进行添加:part-whole(部分)、instance-of(实例)、is-a(种属)、member-of(成员)。这样可以减少知识库中知识的冗余,同时在推理中产生新的知识。(4)对温病古籍知识概念语义网络构建方法的设计、描述。主要包括构建本体、本体实例以及语义关系,实现本体实例之间的关联根据温病古籍知识组织体系,对于构建本体,自行构建本体和顶层本体中的语义类型进行映射,在顶层本体中语义类型之间存在关系,自行构建本体继承了顶层本体的关系,从而实现概念层本体之间关系的构建,自行构建的本体实例由于继承了本体的属性,实现了不同类型本体实例之间关系的构建。基于温病古籍知识概念语义网络构建具体过程如下:基于中医药一体化语言(TCMLS2001),根据对温病古籍知识系统分析,通过知识元标引提取语义成分归纳分类定义语义类型(使用Protege4.0构建类)和语义关系(使用Protege4.0构建对象关系)。利用Protege构建以中医特色的“病、证、症、理、法、方、药”为核心原则的温病疾病、病证、症状、脏腑、百骸、季节、药物、处方、治则治法、医籍、医家本体。将11种本体(疾病、病证、症状、脏腑、百骸、季节、药物、处方、治则治法、医籍、医家)分别与TCMLS中的语义类型进行映射。语义关系的细化实现疾病、病证、症状、脏腑、百骸、季节、药物、处方、治则治法、医籍、医家本体之间的相互关联,以及各实例之间的相互关联;对TCMLS中存在的语义关系进行细分,使其能合适地关联不同类型本体的实例。按照细化原则,通过等价、扩展和阻断三种继承关系,构建疾病、病证、症状、脏腑、百骸、季节、药物、处方、治则治法、医籍、医家本体之间的关联关系,形成以疾病为核心,其他类型本体和疾病之间的关系为主的网状关系,从而构建温病古籍知识语义网络,建立概念术语、本体、实例之间相互错综复杂的关系。本研究目标是构建基于温病古籍知识概念语义网络,除了需要支撑中医古籍知识等可以引入知识后的智能处理外,更需要实现对温病古籍知识获取、处理、分析、应用等方面知识的描述,以实现温病古籍知识的共享,促进温病古籍知识的应用,而后者可能是当前温病古籍知识数字化更应该也更能做到的。
其他文献
背景:在我国,宫颈癌是女性患者中发病率第五位的恶性肿瘤,是女性生殖系统发病率最高的恶性肿瘤,也是每年死亡人数最多的妇科恶性肿瘤。随着社会的发展和性观念的改变,宫颈癌
钱学森从小接受西方式教育,深受西方科学文化的影响。对于教育问题,他从自己当学生、教师及科学家的经历中感悟出了许多富有哲理的见解。钱学森致力于培养学生的科学精神,注
保持党风纯洛陛是关系党和社会主义建设事业兴衰成败的关键所在,理论界和学术界十分重视对保持党风纯洁性的研究,围绕着党的领导人对保持党风纯洁性的论述、保持党风纯洁性的重
<正>近年来,中国飞行试验研究院(以下简称试飞院)工会紧紧围绕试飞院科研试飞、经营开发和改革发展三大中心任务,积极探索开展职工经济技术创新活动的有效途径,在提高职工素
从2004年第一届《超级女声》至今,中国的电视选秀节目已经整整走过了10年。10年中,中国的媒介生态发生了巨大的变化,选秀节目也不断更迭。2012年,《中国好声音》再一次震动整
经典的公司理论建立在决策主体完全理性、有效资本市场的假设基础上,隐含地假定企业经理人都是追求利润最大化的理性决策者。但是,越来越多的资本市场异象和公司异常行为表明
随着国民经济的高速发展以及城市化水平的提高,居民的出行需求日益增长,机动车保有量迅速提升,城市交通拥堵已经成为制约城市发展的瓶颈。基于交通流基本特性,采用路径诱导控
民生新闻经过几年的快速发展之后,不约而同出现一些问题:题材局限在车祸、凶杀等怪圈中;收视率不温不火,难有新的突破;节目的美誉度走下坡路,民生新闻似乎就是“鸡零狗碎”这
汉语属于汉藏语系,在汉藏语系中,量词是其中较为特殊的一类词,它所具有的一些独有的性质,成为对外汉语教学中的重难点之一。论文中主要是以第二语言理论作为指导,对目前对外
连续油管(Coiled Tubing)在工业上名为挠性油管同样也可以称之为盘管。在第二次世界大战期间它就已经出现于工业应用中,自20世纪60年代逐渐引起石油工业的注意。迄今为止已有