论文部分内容阅读
随着生物医学文献的指数性增长,运用数据挖掘的方法从生物医学文献中发现新的知识变得越来越重要,其中一个关键的问题就是文献检索。通过分析文本属性对文献检索性能的影响,提出一种改进的贝叶斯算法,引入文档长度因子,并对文档特征向量进行降维,最后利用代谢相关的文献库进行实验。实验结果与分析表明,相对于一般的贝叶斯方法,改进的算法提高了文献的查全率和查准率,同时降低了算法执行的复杂性。