基于典型数据集的数据预处理方法对比分析

来源 :沈阳工业大学学报 | 被引量 : 0次 | 上传用户:yucol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.
其他文献
为了研究室温条件下6016-T4铝合金板材的高应变速率变形行为,采用分离式霍普金森压杆(SHPB)设备进行应变速率为1600、2300和3200 s-1的压缩变形实验,建立描述材料变形行为的Johnson-Cook本构模型,应用ABAQUS软件进行热力耦合仿真模拟,研究实验过程中合金的变形和温度场变化规律.结果表明:在6016-T4铝合金板材室温高应变速率压缩变形过程中,当应变速率较高时,合金表现出负应变速率敏感性;通过Johnson-Cook本构模型计算出的数据与实验数据吻合良好;通过仿真模拟可知,合金
为了提升钐铁氮磁体性能,分析了钐含量及合金熔炼、热处理、快淬、热压工艺对钐铁氮材料性能的影响.采用熔炼快淬法制备钐铁合金,通过球磨、氮化得到钐铁氮磁粉,采用热压法得到烧结磁体.采用X射线衍射仪、扫描电子显微镜和振动样品磁强计测量样品结构和磁性能.结果表明:样品中各相含量与熔炼方法、热处理条件具有较强的依赖关系;当热压温度约为290℃时,样品可获得最大形变速率;在625 MPa、500℃条件下样品块体密度为6.65 g/cm3,矫顽力约为800 kA/m,剩磁约为0.59 T.