基于蚁群聚集信息素的半监督文本分类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:xy479977530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督文本分类中已标记数据与未标记数据分布不一致,可能导致分类器性能较低。为此,提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计算相融合,利用Top-k策略选取出未标记蚂蚁可能归属的种群,依据判断规则判定未标记蚂蚁的置信度,采用随机选择策略,把置信度高的未标记蚂蚁加入到对其最有吸引力的训练种群中。在标准数据集上与朴素贝叶斯算法和EM算法进行对比实验,结果表明,该算法在精确率、召回率以及F1度量方面都取得了更好的效果。
其他文献
化学是一门以实验为基础的科学,加强演示实验和学生实验,充分发挥实验在化学教学中的重要作用,是激发学生学习兴趣的关键,是使他们积极主动获取知识、培养他们的创造性实践能力的
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
采用动态流变测试研究了角频率、黏度、储能模量、损耗模量、损耗因子等的变化规律,并讨论了它们与聚乙烯分子结构的关系。结果表明:交点模量(Gx)对应的频率越低,聚乙烯的重
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
文章基于中国家庭金融调查(XHFS)的调查数据,分别利用分位数回归和分布函数分解的方法,检验了城乡居民收入水平的主要影响因素,分解比较城乡收入差距中城乡居民禀赋特征构成差异和
江苏省2009年中考物理试卷第12题试题如下:如图1所示,小刚将盛满水的圆柱形透明玻璃杯贴近书本,透过玻璃杯观看书上的鹦鹉图片(圆圈中的鹦鹉图与书本中的鹦鹉图实际大小相等),他所
为了探索超声磨削的工艺特性,研制了轴向超声磨削加工实验装置,对45钢进行实验研究,采用i XRD便携式高速残余应力分析仪测量磨削表面残余应力,从实验角度分析磨削工艺参数对
现场检测是指在货物存放地直接开展的一种质量检测活动,常用于进出口机电产品的检验监管工作中。文章对进出口机电产品现场检测的必要性及其工作质量关键要素进行分析,提出了现
在校长负责制背景下,学校管理实践中经常出现侵犯教师合法权益、剥夺教师自由的权力异化现象。只有教师具有免于外界强制的自由和自主做出选择的自由,才有可能保障学生的教育