【摘 要】
:
蛋白质相互作用关系(Protein-Protein Interactions,PPIs,简称蛋白质关系)对理解生物过程具有重要的意义,从生物医学文本中自动抽取出蛋白质关系可以极大地提高抽取效率。本
论文部分内容阅读
蛋白质相互作用关系(Protein-Protein Interactions,PPIs,简称蛋白质关系)对理解生物过程具有重要的意义,从生物医学文本中自动抽取出蛋白质关系可以极大地提高抽取效率。本文在深入研究现有蛋白质关系抽取方法的基础上,以发掘更有效的平面特征和更合理的结构化信息表达方式为研究主线,采用统计机器学习方法进行蛋白质关系抽取,研究内容主要包括:1.研究各种平面特征对蛋白质关系抽取的作用。本文探索了词汇、组块、句法、依存和语义等各种平面特征对蛋白质关系抽取的影响,并通过特征组合来有效提高蛋白质关系抽取的性能。2.研究结构化信息对蛋白质关系抽取的作用。针对目前结构化信息表达方式所存在的问题,本文提出了利用依存信息来指导句法树的裁剪策略,旨在产生既能涵盖关键结构化信息又能有效剔除噪音的依存指导句法树,从而有效捕获蛋白质关系实例中的结构化特征。在PPI基准语料库上对蛋白质关系抽取的实验表明,词汇信息和依存信息对蛋白质关系抽取的贡献最大,并且各种平面特征的集成能有效提高蛋白质关系抽取的性能;而依存指导句法树则能显著提高蛋白质关系抽取的性能,在目前采用成分句法树的蛋白质关系抽取中取得了最好的性能。
其他文献
数据挖掘,是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。它是一种透过数理模式来分析海量信息,找出不同的数据划分来提供决策支持的方法。
视频中的人物跟踪与行为分析技术是以人为监控目标的监控系统智能化、自动化的基础技术。目前,此类技术在军事、竞技体育等领域已有广泛应用,而在经费支出较少的普通民用领域
随着互联网的普及、软件应用技术和模式的快速发展,软件已呈网络化、平台化和服务化的发展趋势。其中,SaaS(Software as a Service)是一种新型的软件服务模式,凭借其按需租用、
随着智能手机(Smart Phone),掌上电脑(PDA),mp4\mp5,上网本,平板电脑等小型个人终端的迅速发展,带了同一多媒体内容如何在多种终端下正确而恰当显示的问题。而数字图像和视频的获取
医学图像处理与分析是在医学、物理学与计算机科学等学科基础上发展起来的一门学科,其包括图像分割、图像配准、三维可视化、网格处理、有限元分析与虚拟仿真手术等。随着现代
视频会议系统作为网络多媒体综合服务平台,可以使世界各地的合作伙伴和同事之间实现远程的交流沟通与工作协同。而仅仅拥有视频和音频功能的视频会议已经不能满足如今多媒体
随着因特网的快速发展,海量的Web数据资源已经成为人们获取知识与信息的重要来源,如何从庞杂的数据中获取有用的信息是现阶段共同面临的问题,Web信息抽取就是针对这一问题提出的