【摘 要】
:
随着领域非结构化文本的不断积累,各个应用领域迫切地需要从海量的非结构化文本中挖掘出有用的信息,各种文本挖掘技术也相应地快速发展。在中医医学领域中,中医医案是一种重要的信息载体,蕴含了大量的临床经验,对临床诊断和医学研究有着重大的研究意义。但是中医医案文本不仅具有较强的专业性,而且不同的医生多采用不同的表达形式进行表述,从而给中医知识的获取带来了巨大挑战。中科院计算所NKI课题组提出了一套语义分类和
论文部分内容阅读
随着领域非结构化文本的不断积累,各个应用领域迫切地需要从海量的非结构化文本中挖掘出有用的信息,各种文本挖掘技术也相应地快速发展。在中医医学领域中,中医医案是一种重要的信息载体,蕴含了大量的临床经验,对临床诊断和医学研究有着重大的研究意义。但是中医医案文本不仅具有较强的专业性,而且不同的医生多采用不同的表达形式进行表述,从而给中医知识的获取带来了巨大挑战。中科院计算所NKI课题组提出了一套语义分类和描述框架(Framework of Semantic Taxonomy and Description,简称FSTD),以此帮助领域知识获取和常识获取等工作。作为一项具体的领域应用,该课题组在从事名老中医医案知识获取研究中,以该框架为基础编写了一套文法(称为语义文法Gseed),并实现了中医医案解析器。但中医医案解析器十分依赖于语义文法产生式的数量和质量,如果语义文法中缺少某些文法,则可能导致一些句子无法被解析,致使部分领域知识被遗漏。本文针对上述问题,从语义文法扩展的方面对中医医案解析器进行优化,并对解析结果进行可视化。本文的主要研究内容如下:(1)提出一种基于Earley容错解析算法的领域语义文法的自动扩展方法。本文从完善语义文法的方面对解析器进行优化,实现了一种领域语义文法的自动扩展方法,包括词类词条的扩展和文法产生式的扩展,以此自动生成新的语义文法产生式和词条,从而帮助提高语义文法的覆盖范围,更准确地解析文本。实验表明,本方法可以提供大量有效的语义文法帮助人工进行语义文法的完善。(2)提出一种中医医案内容抽取的可视化方法。本文使用的中医医案解析器以语义文法为基础,利用Earley解析算法对文本进行解析,最终获取到包含知识内容的领域解析树。为了将抽取的领域知识整合成一个完整的事件描述,使用户有效地分享和学习领域知识,本文实现了一种中医医案内容抽取的可视化方法,将领域内容解析树自动转化为以领域知识模型为模型的知识描述,对抽取的领域知识进行可视化。本方法具有普适性,可通过改变领域知识模型以满足不同需求的应用场景。(3)设计并实现了一个原型系统。本系统包括了两部分:语义文法更新扩展与文本抽取可视化。针对语义文法的更新扩展,本系统设置了人工校对自动扩展结果功能、格式校验功能、反馈功能、语义文法更新功能等,利用人工干预与自动扩展结合的方式对语义文法进行更新,以此来减少优化中医医案解析器时花费的人工成本。针对文本抽取可视化,本系统提供了以中医医案为输入、领域知识模型形式的抽取结果为输出的抽取接口,供第三方使用;并提供了页面展示,以供医院、医生等非专业人员进行使用。
其他文献
在人工智能界,常识知识获取一直是公认的核心难题。所谓常识,是指日常生活中人与人之间存在的共识。人们的观念不断改变,常识也在不断发展。常识知识在自然语言处理、计算机视觉等领域都有着广泛的应用,但常识具有隐含性、大规模性、无领域性等特性,并且常识的理解机制尚不明确,使得常识知识获取成为限制人工智能发展的瓶颈问题。目前,根据自动化程度可以将常识获取的方法分三类:手工获取能够得到隐式的常识,但耗费大量的人
在互联网以及信息技术飞速发展的今天,物联网(Internet of Things,IoT)的研究得到了广泛的关注和重视,我国已经将物联网列入了国家的五大新兴战略性产业之一.物联网按照特定的网络协议将物体接入互联网,进行数据的交互,使得物物相连.随着人们生活水平的提高,物联网正在被逐渐被应用到家庭之中,例如家庭中的安防系统,灯光控制系统,温度检测系统等,物联网技术在家庭中的应用使得人们生活变得更加安
道路是现代交通的主要组成部分,对于管理和更新地理信息系统数据库中的道路信息非常重要。遥感图像数据已经迅速成为自动提取道路网络的主要数据源,它可以提供高精度的地面信息以及更复杂的背景细节,还可以进行大规模的道路监控,给道路提取带来了很大的改进空间,然而目前视觉判读仍然是更新道路的主要方式,这种方式成本高、需要耗费大量的时间和物力,给自动提取道路任务带来了影响。高分辨率遥感图像中的道路具有较大的类内差
人脸表情蕴含着丰富的情感信息,在人际交往沟通中起非常关键的作用,如何让计算机正确的识别理解人脸表情信息是一项具有重要意义且极具挑战性的工作。随着深度学习的发展,利用深度学习技术实现人脸表情识别成为了表情识别领域新的研究热点。人脸表情特征大多集中在人脸的局部关键区域,如眼睛、眉毛、嘴巴及其周围区域,人们可以忽略人脸的整体信息,而直接借助人脸的局部关键区域信息,来正确的识别人脸图像中的表情类别。因此,
随着教育信息化的发展,可视化教学成为教育研究者关注的热点之一。如何运用信息技术将可视化教学与学科教学融合的方式来发展学生的科学素养是亟待解决的重要课题。由于晶体结构与性质内容具有抽象性、微观性和复杂性等特点,并且该内容对学生的空间想象能力和立体几何知识要求较高,因此教师在进行讲授时很费力。2017版课标提出教师可以借助实物模型、计算机软件模拟和视频等多种直观手段,降低教学内容的抽象性,促进学生对相
视觉目标跟踪是计算机视觉领域中的重要研究方向之一,它被广泛应用在很多领域,其中主要应用在视频监控、自动驾驶和军事指导等领域当中。在当前主要以孪生网络作为发展的目标跟踪方法当中,候选目标区域中推荐的质量显得十分关键。模型更新问题也成为相应目标跟踪方法中的重要研究内容。当前跟踪方法大多数都是采用锚点固定作为推荐的一种方式,该方式所生成的候选区域数量都是非常庞大的,但是质量并非很高。并且在孪生网络中,目
基于皮尔逊相关系数的决策树(PCCDT)算法是决策树领域的一种贪婪型算法。其广泛应用于模式识别和信息检索领域,能够帮助医疗机构更精准地对病人进行诊断,帮助企业或个人更好地做出决策等。然而,当数据集中包含个人敏感信息(如病人的诊断信息,顾客的购物信息等),在决策树使用过程中遭到具有一定背景知识的恶意用户攻击时,个人的隐私安全就会受到威胁。如何在决策树使用过程中对敏感信息进行保护,同时又能保证决策树的
随着互联网的迅速发展,网络上存在的信息呈指数级增长,用户从这些海量而复杂的数据中筛选自己感兴趣的内容的难度也随之增加。推荐系统作为一种有效的信息过滤工具,得到了广泛的应用,它的目的是准确地预测用户对物品或信息的偏好程度,从而把对用户更有价值的内容优先呈现给他们,帮助用户做出快速的决策。协同过滤在推荐算法中被广泛应用,它是基于相似用户具有相似偏好的假设进行推荐的,但是当用户的历史评分数据很少或没有评
雾霾是由于空气中悬浮着微小颗粒而产生的。随着数据科学与人工智能的飞速发展,诸如安防监控、智能驾驶、车牌识别、军事勘测、林业预警等基于计算机视觉处理系统的任务对于图像的清晰度有着越来越高的要求,雾霾的存在使得图像采集系统获取到的图像出现可见度降低、模糊泛白、色彩饱和度下降等情况,严重阻碍了基于计算机视觉处理系统的后续任务的有效进行。因此对有雾图像进行有效去雾,使计算机视觉系统能够在有雾霾的情况下正常