基于机器学习LightGBM和异质集成学习方法的新闻分类

来源 :电子制作 | 被引量 : 0次 | 上传用户:zhaoyangfei1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
娱乐新闻是腾讯新闻重要组成部分,根据娱乐文章的文本信息将文章归类是娱乐新闻处理工作中很重要的一部分。人工智能中的机器学习方法在经济生活中有着十分广泛的应用。根据娱乐新闻分类这一问题实例,分别采用了传统的机器学习方法,包括朴素贝叶斯,逻辑回归,基于集成学习的方法lightGBM,对这一分类问题进行探索。最后采用异质集成学习方法对最终结果进行集成。不同的模型在不同的问题中具有不同的效果,本文依据娱乐新闻分类这一具体问题,采用了上述几种算法模型进行预测,综合了不同模型的预测情况得出最后的预测结果。对算法模型进行
其他文献
该文对妊娠滋养细胞疾病的特点和分类做了归纳说明,将WHO分类(2003年)和FIGO分类(2000年)的主要不同点做了比较。临床和病理的不同分类会对诊断和预后评估产生影响。从病理角
为探究后锚固群锚试件在纯弯作用下锚板刚性性能的发挥,设计并制作了9个不同锚板厚度与锚栓间距的后锚固试件,主要研究了试件的破坏形态、极限承载力、锚栓应变、锚板应变和
随着新公共管理运动的兴起,传统的单纯以财务指标来评价地方政府业绩的观点受到质疑。20世纪80年代以后,理论界开始对企业业绩评价范式进行创新,开发了一系列新型的业绩评价方法
虎门童装年销售额达96.85亿元据虎门镇经信局和虎门服装服饰行业协会调查,在虎门庞大的服装产业集群里,童装约占1/4份额。截至2012年底,虎门有童装企业约600家,年产值约50亿
目的探讨肌肉能量技术(MET)治疗膝关节骨性关节炎疗效的研究。方法选取35例符合入选标准的膝关节骨性关节炎患者,随机分为治疗组(n=18例)和对照组(n=17例)。对照组采用常规超
限制坡度是铁路选线中重要的技术标准之一,尤其在复杂山区铁路中,对工程投资和工程风险控制有重大影响。文中通过从不同限坡方案的平纵断面条件、工程情况和投资、换算工程运营
海水淡化技术是解决未来淡水短缺问题的主要途径之一,常规能源的严重短缺,使得太阳能等可再生能源成为关注的焦点,因此太阳能海水淡化有很大的应用前景。本文介绍了太阳能海
纵观塔尔科夫斯基的影片,不论是作为主角的人还是构成景象的物,都被投放至一个广阔的空间内,传递出画面外部引伸出的多义性,给予观众无限的解读空间。塔氏一向以平缓的镜头不
20世纪40年代末以来的中菲关系大致可以分为四个时期:20世纪40年代末到60年代末的对华"隔离";60年末到90年代初期马科斯和阿基诺总统期间的缓和、建交与发展时期;拉莫斯以及
随着我国教学改革思想的不断深化,新课改对高中英语教学提出了更高的要求。既要教会学生基本的英语知识,又要侧重于学生英语表达、交流能力的培养。采用传统的教学模式越来越