论文部分内容阅读
目前广为应用的文本过滤技术是利用关键字检索,没有考虑概念之间的关联,因此其过滤性能在达到一定程度后,很难有突破。介绍了一种基于领域本体的文本过滤模型DOTFM,探讨了领域本体在文本过滤中的应用。DOTFM在文本向量的表示和用户模板建立中引入概念关联度,并提出局部型和全局型的文本向量和用户模板。实验结果表明,DOTFM的召回率比之传统的基于关键字的过滤模型有较大提高,而其准确率在合适的阈值时,也有较大提高。