不平衡数据集文本多分类深度学习算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:edyzhang1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本多分类算法中,由于不平衡数据集产生的小样本分类数据准确率低问题,提出基于轮廓系数动态K-means聚类的文本多分类混合式均分聚类采样算法。在不平衡数据集中针对小样本数据集利用聚类簇进行等比例过采样,针对大样本数据集利用聚类簇进行欠采样。基于微博灾害数据集,设计文本卷积神经网络,对该算法进行实验验证与分析,实验结果表明,该算法能够有效提升文本不平衡数据集的准确率和F1值,较好解决了不平衡文本数据集分类问题。
其他文献
由于网络新闻评论的开放性和传播性,经常引发舆论事件,为能正确引导社会舆论,需要重点关注某些具有较高影响力的用户。针对已有方法未能全面考虑表征网络新闻评论用户影响力的因素,提出四度用户影响力分析模型——FDRank(four-degree influence rank),通过综合考虑用户的评论内容、评论情感值、自身质量以及网络结构4个方面,使用线性融合的方式对用户的影响力进行分析。实验结果表明,把用户评论情感值作为评价用户影响力分析的因素之一,能使模型获得更好的结果,与多种传统算法进行对比,FDRank算法
EPC总承包模式下,建设单位减少对设计、采购过程的管控与参与力度,注重项目最终成果目标的全面实现;EPC总承包方主导设计阶段、施工阶段、采购等各项工作,并全方位负责工程的造价控制、工期、质量等。基于此,为应对建设方及EPC总承包方的项目管理,阐述了EPC工程总承包管理特征,以此分析该模式下工程项目监理工作难点及风险点,并提出了监理项目的管理思路及要求,以期对工程建设监理项目管理有所裨益。