基于基尼指标和卡方检验的特征选择方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:snake_icy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的机器学习分类算法在非平衡数据集上准确率较低的问题,提出一种基于随机森林Gini指标和卡方检验的最优特征子集的特征选择方法(RFG-χ^2),并应用于支持向量机算法模型中。利用SMOTE算法对非平衡数据集进行预处理,通过权衡特征的关联性和特征强度这两个指标,训练生成支持向量机模型所需的最优特征子集。实验结果表明,该方法在支持向量机(SVM)模型上筛选的两个特征子集对应的分类精度分别提高了2.5%和1.5%。
其他文献
针对传统边缘检测算法对微弱边界检测性能弱且时间复杂度高的问题,提出一种有效的微弱边缘检测算法。利用二进制分割的方法建立曲线二叉树,构建多尺度匹配滤波器;利用自下而上搜索策略检测可能的边缘曲线;根据检测阈值分配边缘曲线得分,确定检测的边缘。模拟加噪图像、自然景观图像、生物医学真实图像的实验结果验证了提出方法的有效性,与传统方法相比,其微弱边缘检测性能大幅度提高,具有更强的抗噪性能。
随着我国经济发展与居民消费水平的不断提高,国内摩托车与汽车消费市场中,国外进口整车占比不断提高。尤其在摩托车销售市场领域,年轻化与高端化趋势并行,高端大排量,休闲运
造纸法烟草薄片生产过程中,沿用传统造纸行业磨片材质和齿形,无法适应烟草物料的特殊性,存在纤维切断强烈、细小组分较多等问题,严重制约片基的物理指标和抄造的稳定性。主要
工程造价管理作为工程项目管理中非常重要的组成部分,它决定着建设工程的投资效益。由于工程项目涉及的环节较多,在决策阶段、招投标阶段、施工阶段及竣工阶段等每个阶段都需
针对机器翻译中存在的特征权重的领域自适应问题,提出一种联合最小贝叶斯融合的系统权重训练方法。在协同训练的框架内,采用不同解码器的输出作为参考译文,通过扩展开发集,保
4结束语通过双余度的曲轴位置传感器及MAX9926的自适应峰值阈值、过零检测功能,辅之双位置传感器的故障诊断、四重信号滤波,电喷系统能更精确地识别曲轴转角,更准确地计算发