TF-IDF函数相关论文
为了解决传统TF—IDF函数由于忽略特征项之间的联系带来的诸多问题,对TF-IDF函数在文本分类中的应用进行了研究.结合信息论相关知识,......
DDM模型在现在流行的LDA模型中引入了残差分量来弥补判别信息的丢失,而由于文档词汇服从幂律分布,导致残差分量会受到高频主题词汇......
东巴文本的模型表示是实现东巴文本自动分类的基础。通过分析常用文本表示模型,选择空间向量模型用于东巴文本的表示;通过引入词性......