【摘 要】
:
特征预测能力检测是一种为输入数据集的特征进行评分的方法,其依据是特征与目标类别之间的相关程度。现在已经提出一些特征预测能力检测方法,如基于随机森林和基于逻辑回归的检测方法。但是这些方法仍然存在一定的局限性,它们只能够得到单一特征的预测能力点估计,而不能表示特征取不同特征值的预测能力分布。为了解决上述问题,本文提出了一种基于高斯朴素贝叶斯分类器的特征预测能力检测方法,该种方法使用朴素贝叶斯方法作推断
论文部分内容阅读
特征预测能力检测是一种为输入数据集的特征进行评分的方法,其依据是特征与目标类别之间的相关程度。现在已经提出一些特征预测能力检测方法,如基于随机森林和基于逻辑回归的检测方法。但是这些方法仍然存在一定的局限性,它们只能够得到单一特征的预测能力点估计,而不能表示特征取不同特征值的预测能力分布。为了解决上述问题,本文提出了一种基于高斯朴素贝叶斯分类器的特征预测能力检测方法,该种方法使用朴素贝叶斯方法作推断,而不同于以往的分类任务。本文的方法可以得到特征的每一个特征值的预测能力,即预测能力分布。具体来说,此方法可以根据朴素贝叶斯方法的条件独立性假设,估计出每一个特征的高斯分布参数。使用该参数生成高斯分布计算出每一个特征值的预测能力,由此将得到的不同特征值的预测能力使用柱状图画出,更加直观的表示出具体的特征预测能力分布的变化。实验包括了8个不同样本容量的数据集,涵盖了生物、医学、自然语言处理和计算机视觉四个不同的领域。实验结果证明了本文提出的方法在真实数据集上的有效性。但是,该种方法只可以将特征值拟合到一个高斯分布中,其高斯分布参数可能导致所有特征值无法拟合到最适合的高斯分布中,没有办法处理临近值的预测能力存在巨大差异的情况。为了使得特征值能够拟合到最适合的高斯分布,使得模型更加适用于样本复杂的数据集,本文提出了带有段数因子的高斯朴素贝叶斯分类器的特征预测能力检测模型,通过使用十折交叉验证与网格搜索法相结合的超参数调节方法调节数据集的段数因子,得出数据集与模型拟合程度最高的段数值大小,使用该段数值来拟合模型与数据集。进而使用得到的引入段数的高斯朴素贝叶斯分类器模型画出不同特征值的预测能力分布。通过实验发现该模型方法能够有效提高预测能力检测的准确度。
其他文献
滑坡发生时对人民的生命与财产安全伤害极大,对其进行风险评价可在一定程度上防患于未然。目前已有的滑坡风险评价方法以物理模型和知识驱动模型为主,其评价结果依赖于模型本身,而依赖于数据的评价模型研究较少。为了对甘肃省滑坡灾害的风险等级进行划分,本文以甘肃省为例,运用GIS技术、统计学方法和机器学习算法对甘肃省滑坡的易发性、易损性和风险进行评价,评价方法可充实滑坡风险评价理论体系,同时可为政府部门和社会团
目的:探讨全息经络铜砭刮痧治疗寒湿凝滞型原发性痛经的临床疗效及作用机制。方法:选取60例符合纳入标准的寒湿凝滞型原发性痛经患者,随机分为两组,观察组30例和对照组30例。观察组于经期来潮前第5天和经期第1天各行1次全息经络铜砭刮痧治疗;对照组自月经来潮前3日起口服布洛芬缓释胶囊,连用5天,两组患者均治疗3个月经周期。比较两组患者治疗前、治疗3个月经周期后及治疗结束第3个月随访时疼痛数字评分(NRS
目的 在全球人口老龄化背景下,探究整合性照护和在地老龄化的理论基础和实践形式,构建服务设计策略,建立可及的、高效的、满意的在地老龄化服务系统,提高老年人社区或家庭养老的生活质量和医疗体验。方法 通过文献对比研究、案例分析和叙述研究的方法,探究在地老龄化照护的理论依据和创新机会点,构建相应的设计策略。结论 建立跨学科的设计合作团队、参与式设计过程和服务过程、创建以用户为中心的可持续服务传递系统、关注
使用计时工具,敲定确切时间,是现当代人们日常的生活需要。我国古代计时器诞生以来,经历过类型、科学、技术、设计等多方面的长足发展,直至式微。古代计时器的设计基调视野开阔,包容万象。时间的规律性“有限”但变化运动“无限”,与“有限”的空间方位和“无限”的宇宙运转相互融合下,形成“时空融合”的计时器设计思维走向。我国的时间计量建立在实践基础之上,来自于天空可视的星辰日月,来自于地面具有节律性的物候,始终
<正>一、前言公立医院开展诊疗服务与提升医疗技术水平,离不开医疗设备、耗材和工程等项目的招标采购。规范采购行为,提高采购效率,降低采购成本是医院采购管理的目标,采购专业化、规范化和制度化已逐步发展为一种新常态。优化招标采购管理体系对提高医疗服务质量、提升医院运行效率具有重大意义[1]。本文以H公立医院为例,通过分析H医院招标采购中出现的问题,
刚入园小班儿童从熟悉的家庭环境到陌生的幼儿园集体生活,情绪失控现象时有发生。晨晨作为班级之中情绪自控能力比较弱的幼儿,无论是在区角游戏还是在一日生活的其他活动中,经常会出现情绪失控现象。在儿童情绪失控的背后,体现出小班儿童无法适应环境改变、无法处理同伴冲突、不愿遵守群体规则等问题。文章在分析问题的基础上,提出增加家园联系,随时保持与家长沟通,及时反映幼儿在园情况,开展家庭教育,提供管理幼儿情绪方法
设计了一种模糊控制的四轮全位移平衡机器人,通过SolidWorks改进设计了基于麦克纳姆轮的全位移平衡底盘、双轴云台等机械结构。以Altium Designer为开发平台设计了STM32F405核心板主控,外设电路设计主要包括:ICM20948传感器电路、CAN通信差分电路等。使用Simulink对算法进行仿真验证,云台控制算法使用了串级PID控制,底盘通过HI220陀螺仪传感器结合模糊控制算法实
<正>木兰是南北朝乐府民歌《木兰诗》中塑造的女扮男装、替父从军、保家卫国的巾帼英雄形象。诗中木兰的称谓有:木兰、女、将军、壮士、儿、姊、妹、我、女郎。孙光老师在《<木兰诗>称呼里的意境》一文中,从“‘女’中寄深情”“‘儿’里有乾坤”“‘我’方为本真”三个方面谈了“女”“儿”“我”称谓里的意境。笔者想谈谈另外六个称谓:木兰、将军、壮士、姊、妹、女郎,这六个称谓既展现了木兰金戈铁马驰骋疆场的英雄本色,
目的:对下肢骨折患者行切开复位内固定术,术后应用消肿止痛合剂辅助低分子肝素钙进行干预治疗,探讨下肢骨折术后应用消肿止痛合剂辅助低分子肝素钙预防下肢深静脉血栓形成的疗效。方法:选取2021年1月至2021年12月,年龄在18至60岁之间,就诊于甘肃省中医院创伤骨二科病区的下肢骨折患者,共收集120人,随机分为观察组60人及对照组60人。两组患者字入院时起予以低分子肝素钙皮下注射,0.4ml(4100
随着社会经济的飞速发展,行业竞争激烈,实现价值最大化是公司开展各项活动地终极目标。公司想要在市场中取得竞争优势实现长期稳定的发展,就必须采取必要的方法和有效的控制手段。目前成本控制已经成为大多数公司作为长远发展的关键措施,有效地、科学地成本控制有利于公司各生产要素充分发挥价值,提升产品在市场中的竞争力,提高公司的经营利润和效益。近几年来,汽车行业市场整体销售规模呈下降趋势,各大汽车厂商纷纷寻找突破