基于无词典分词的中文生物医学文献相关性数据库构建方法研究

来源 :北京协和医学院 中国医学科学院 清华大学医学部 | 被引量 : 0次 | 上传用户:guoln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为提升生物医学文献检索系统智能化水平的一种重要手段,基于生物医学文献相关性数据库的相关文献检索对于满足医疗卫生领域临床、教学和科研人员的知识需求有重要意义。中国医学科学院医学信息研究所近年来对中文生物医学文献相关性数据库的构建方法进行了大量的研究,但中文自动分词方法和文献相关性判定的时间复杂度两大问题,仍有待深入探讨。本研究针对中文自动分词问题,尝试引入一种基于重现原理的无词典分词方法,通过对分词结果的分析,初步证实了该分词方法在中文生物医学文献相关性数据库构建过程中应用的可行性;针对文献相关性判定时间复杂度问题,尝试提出“倒排-SIM法”,较明显提高了文献相关性判定的速度,为中文生物医学文献相关性数据库的应用实践做了技术上的铺垫。最后,通过相关准率、MAP和P@10三个指标的综合评判,表明本研究中基于无词典分词构建的文献相关性数据库在相关文献揭示的整体效果上,达到了和原来基于词典分词构建的中国生物医学工程文献相关性数据库相同的水平,证实了基于无词典分词构建中文生物医学文献相关性数据库的可行性。
其他文献
伴随着全球化步伐的加快,越来越多的研发企业开始采用项目组的方式开展活动,项目知识共享也受到了广泛的关注。本文主要针对企业项目知识共享展开,重点讨论了项目知识共享模
目的:提高临床合理用药水平,提高药师处方审核的效率与质量,构建医院审方中心平台,探讨在临床合理用药中的效果.方法:引入审方中心系统,通过建立和维护系统的知识库,协助药师
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统
期刊