构建生物医学文献相关性数据库

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:lxy850628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用后缀树向量空间模型(VSM),为每篇文献建立相应的基于内容的向量模型,通过夹角余弦得出文献之间的相似度,再结合中国医学科学院医学信息研究所提供的文献数据,最终构建出医学文献相关性数据库。该模型与传统的基于词表的VSM相比,最大的优点表现为:在获得文本的向量表示时,不需要基于词表的分词和特征项提取,而其这一特点正好能够解决现在相关性数据库中词表的建立和维护问题,从而使得该模型能够实时获得文本的向量表示。该模型的另外一个优点是与语种无关。
其他文献
肺癌在我国的发病率较高,属于恶性肿瘤之一,发病后的症状主要有咳嗽、胸口疼或发热等,严重威胁患者的身心健康。且该病还具有较高的发病率和病死率,其中非小细胞肺癌(NSCLC)
面向对象编程是当前软件开发的主要方法,而关系数据库在短期内有其不可替代的地位,因此,怎样实现对象模型到关系模型的映射就成了软件开发中一个重要的问题。本文结合一个工
传感器网络由大量能量有限的微型传感器节点组成,如何延长网络的寿命是一个需要解决的重要问题。针对矩形传感器网络,提出一种基于分层的非均衡分簇算法,通过分析节点的能耗来计
著名作家茅盾的名篇佳作为广大读者所熟悉,而他的某些早年作品,就不大为人所知。短篇小说集《野蔷薇》就是茅盾创作《林家铺子》《春蚕》等名篇之前尝试短篇小说创作的第一批
目的探讨血细胞分析仪检测网织血小板(RP)诊断血液相关疾病的价值。方法选择2017年8月至2019年3月医院收治的70例免疫性血小板减少症(ITP)患者、70例非ITP患者及50名健康对照
针对工厂设备的控制系统设计问题,介绍了基于WinCC脚本开发的监控系统解决方案。使用C脚本实现了简单易用的画面布局与组织关系,结合用户需求实现了数据归档、报表打印与用户管
目的分析无痛分娩产程护理中应用循证护理的效果。方法选取2019年6月至2020年6月本院收治行无痛分娩的98例产妇为研究对象,随机平均分为两组各49例。对照组采用传统护理;试验