基于多特征融合的线性内核SVM法挖掘生物实体关联

来源 :中国生物医学工程学报 | 被引量 : 0次 | 上传用户:cailing12530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提高挖掘生物医学文献中的实体关联算法的性能,对开拓研究新思路有重要启示作用。提出一种改进特征的新线性内核SVM关联挖掘方法,以糖尿病相关文献摘要为研究内容,总结归纳出5种实体关联挖掘特征:实体特征、实体对特征、依赖图特征、解析树特征和名词短语约束特征,其中实体对和名词短语约束是所提出的新特征,并使用Huber损失函数作为SVM分类器的线性内核进行计算,挖掘预测疾病、基因和药物实体之间的关联。计算得到10种糖尿病相关病症和23种基因有173种关联,13种糖尿病相关病症和26种药物存在79种关联,18种基因与17种药物组成了159种关联,构建出疾病-基因、疾病-药物、基因-药物和8种糖尿病相关疾病基因药物的关联网络,共计619种实体关联,同时预测出27种新实体关联对,最后使用ROC曲线验证3种关联(0.804、0.847和0.742)。结果表明,所提出算法与Co Pub(0.710)、Pub Gene(0.609)、FBK-irst(0.547,0.800)和WBI(0.510,0.759)所用算法相比,最高精确度提升超过约5%(0.847与0.800),最低提升超过约20%(0.742与0.510),性能更优,为下一步在生物医学大数据中的应用打下良好基础。
其他文献
中国工程院1月5日正式公布了2003年增选院士名单,华中农业大学副校长、博士生导师陈焕春教授从628名有效候选人中脱颖而出,当选中国工程院院士。
山西省长治市物资再生利用集团公司党支部,狠抓党的基本路线教育,用经济建设是新时期全党的中心工作这一指导思想,武装干部、职工头脑,行政领导紧抓机遇,带领职工闯市场;党
为了更好地培养学生职业能力,我们有珏要从分析成本会计工作任务出发,根据学习领域课程的开发路径和步骤开发高职会计专业核心课程《成本核算与管理》。选择不同生产类型的企业
目的探讨非手术脊柱减压系统(SDS)牵引治疗神经根型颈椎病(CSR)的疗效及其对患者颈部肌肉表面肌电信号的影响。方法选择2014年2月~2016年2月中山大学附属第一医院康复科收治的CSR
国际水协根据各国具体情况,对供水管网漏损组成提出一套相对完整且具有较强适应性的分类方法。根据这一分类方法,结合供水区域实际情况,从管网施工、计量抄收、抢修维护、打