中医药信息语义集成与知识发现若干问题研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:supercow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中医药文化源远流长,至今已有五千多年的历史。中医药理论博大精深,积累了海量数据,却分散庞杂,且往往数据丰富但知识贫乏,这对中医药信息的充分利用、中医药诊疗经验的总结、中医药知识体系的丰富和发展形成了重重障碍。因此,如何集成大量散在的中医药信息和设计适应中医药特色的知识发现算法便成为迫切需要解决的问题。并逐步演化为中医药学结合计算机技术开展跨学科研究的热点。主要内容包括: (1)中医药信息语义集成体系研究:针对中医药信息集成需求,提出一个融合网格、本体、数据仓库、知识发现、信息抽取和数据流监测等技术的三层语义集成体系,并采用GT3.2实现了一个基于网格的中医药信息语义集成系统TCM-SGrid(TraditionalChineseMedicineinformationSemanticintegrationsystembasedonGrid)。 (2)中医药信息语义集成方法研究:引入语义相似性栈,并按其自底向上顺序分层探讨了计算实体(本文指概念和属性)间相似性的启发规则,在此基础上分别设计了一个领域本体间自动映射算法及一个综合考察“服务本体语义相似性”和“动态服务质量满足程度”两项指标的网格服务发现算法,解决了TCM-SGrid系统中领域本体的异构和基于语义模型的网格服务发现等语义集成方法问题。 (3)中医药概念识别研究:为加速TCM-SGrid所集成的中医药文本信息的整理和结构化,中医药领域概念的自动有效识别变得尤为重要。为了克服中医药领域训练样例少和CRF(ConditionalRandomField)模型过度拟合等缺点,本研究采用不确定性、样例代表性、批量样例多样性三项指标作为训练样例的选择标准,设计了基于2-pool多标准主动学习的CRF算法,实现了文本信息中中医药领域概念的有效识别。 (4)中医方剂数据挖掘研究:选择TCM-SGrid系统中集成的方剂作为数据集,将基于互信息的特征选择遗传算法融入CMAR(ClassificationbasedonMultipleAssociationRules)算法,通过规则组强度来构建多关联分类模型,设计了面向中医方剂高维数据集的多关联分类算法I-CMAR,该算法在内存占用、运行时间、分类精度等指标上均优于其他同类算法。 (5)中西医病理、生理因素在线相关性研究:引入基于医疗传感器网络的数据流管理模型,提出一种面向高维数据的在线典型相关性(CCA)分析算法QuickCCA,针对传统CCA计算中的性能瓶颈,在系统内存资源受限情况下,采用不等概率的列采样技术实现实时流数据约减,形成概要矩阵;然后在概要矩阵基础上增量计算多维数据流间前k个典型相关系数,以期实现算法在精度与性能之间的折衷。为基于医疗传感器网络的高维中西医病理、生理因素在线相关性研究提供了解决方案。
其他文献
工作流技术的研究正日益受到人们的重视。然而,作为一个新兴的研究领域,工作流还存在着很多问题有待进一步研究和解决,其中之一就是系统的安全问题。本文的研究重点是工作流
人类社会正在从工业社会迈向信息社会,信息的主要载体是自然语言,即人类彼此交流所使用的语言。自然语言处理研究如何让计算机理解人类语言并开发有关的适用系统,然而自然语
随着经济的发展、科技的进步,图像作为一种信息传播方式越来越被人们所重视。然而由于图像存储和传输占用太多的空间和带宽,因此,寻求有效的图像压缩编码方法具有重大意义。近20
随着互联网和信息技术的飞跃发展,作为信息过滤的一项重要解决方案,个性化推荐技术得到了广泛的研究与应用,各大互联网网站纷纷提供了个性化推荐服务以提高网站的核心竞争力
近几年来伴随着信息技术和互联网络的飞速发展,全国各地智慧城市建设如火如荼,使得视频安防监控系统在各行业的应用日渐广泛,视频流的播放、存储、传输作为视频监控系统的重
SOA是面向服务的体系构架,以企业的业务作为系统的构建单元。它的一个中心思想就是让企业应用彻底摆脱面向技术的解决方案的束缚,轻松应对企业商业服务变化、发展的需要。本
沥青路面是我国高等级公路的主要型式,沥青混合料的级配是影响沥青路面使用性能的主要因素,是沥青路面施工质量过程控制中的重要检测内容。传统的检测方法操作程序复杂、费力
随着计算机网络应用系统的发展,网上培训系统已经成为教育、企业、政府等部门提供教育的一种重要方式。然而,与任何教学方式一样,要提高网络培训效果,根据学员的基础和能力来
道路交通标志是一种包含了大量交通信息的道路设施,它对保证驾驶员的安全驾驶有着重要的指导作用,但通常由于驾驶员疲劳驾驶或者大意疏忽等原因忽略了道路上的交通标志牌而酿
Web已经成为如今人们获取知识的主要来源,但是随着Web上数据信息量的日益增加,人们从Web上搜索真正需要的信息已变得不再容易。因此,如何让计算机能够理解数据的含义,帮助人们方