Bagging中文文本分类器的改进方法研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:tornadohearwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类研究中,集成学习是一种提高分类器性能的有效方法.Bagging算法是目前流行的一种集成学习算法.针对Bagging算法弱分类器具有相同权重问题,提出一种改进的Bagging算法.该方法通过对弱分类器分类结果进行可信度计算得到投票权重,应用于Attribute Bagging算法设计了一个中文文本自动分类器.采用kNN作为弱分类器基本模型对Sogou实验室提供的新闻集进行分类.实验表明该算法比Attribute Bagging有更好的分类精度.
其他文献
中国在改革开放之后,经济取得了飞速的发展,但这种发展是建立在大量消耗能源资源的基础上,是粗放式的发展,为此造成了环境污染、生态失衡、资源耗竭等一系列问题,为增强经济
《夜色温柔》是菲茨杰拉德继《了不起的盖茨比》之后的又一部长篇小说。仔细阅读后 ,读者会发现 :它并不是一部“在结构上混乱 ,缺乏清晰的人物典型”的作品。相反 ,整部小说
溧阳中关村科技产业园内,江苏中兴西田数控科技有限公司大楼的大堂和办公室过道里,一句题词异常醒目——“振兴中国锻压事业,创新智能制造装备”。这是原机械工业部部长何光远先
报纸
作文是人文的载体,是考察学生语文素养的重要标尺.写作教学是语文教学的重要组成部分,也是对学生进行语文素质综合训练的主要阵地.而且作文也能带动其他语文知识能力(阅读能
近年来,随着人类活动的日益频繁,尤其是城市化进程和工业化进程的快速推进,消耗了大量能源并释放出大量污染物,从而导致全球性的气候和环境变化,如高温、酸雨及大气氮沉降等
主要研究了镍渣-矿渣复合微粉的活性,及其对混凝土坍落度、强度和抗氯离子渗透性能的影响。试验结果表明:镍渣-矿渣复合微粉的活性随着矿粉含量的增加而变强,且当复合30%矿渣
目的:观察瑞芬太尼复合丙泊酚用于宫腔镜手术的麻醉效果。方法:选择宫腔镜手术患者50例,随机均分为瑞芬太尼复合丙泊酚组(R组)和芬太尼复合丙泊酚组(F组)。R组以瑞芬太尼0.1μg/kg&
云冈石窟造像是在汉代造像基础上吸收印度艺术各流派而产生的新艺术,为了更好地研究和了解云冈石窟中的佛教造像艺术,必须溯其渊源,了解古代印度、犍陀罗、秣菟罗、摩揭陀等