【摘 要】
:
分类问题是大数据处理的典型问题之一,其主要研究内容是如何通过模型以及算法来确定数据间的分界,使得对数据进行正确的划分.常见的方法有决策树法,支持向量机,Bayes方法等.C
论文部分内容阅读
分类问题是大数据处理的典型问题之一,其主要研究内容是如何通过模型以及算法来确定数据间的分界,使得对数据进行正确的划分.常见的方法有决策树法,支持向量机,Bayes方法等.Choquet积分是由法国数学家Gustave Choquet在1953提出的一种非线性积分,它是Lebesgue积分的推广.近年来,Choquet积分在决策、数据融合、数据挖掘等方面取得广泛的应用.本文在Choquet积分对数据分类的研究基础上,结合支持向量机最优分类边界的思想,对Choquet积分的数据分类进行了深入分析,建立了基于Choquet积分的数据分类优化模型及算法.主要的研究工作如下:(1)对序加权平均算子的概念进行推广,引入序加权算子,进而建立了基于序加权算子的数据分类优化模型,并对其分类能力进行分析比较.(2)通过对Choquet积分进行数据分类本质的分析,提出了n-维空间的加权轴及空间两点间的Choquet距离,借助支持向量机最优分类边界的思想,建立了基于Choquet积分数据分类的非线性约束优化模型,并通过实例验证模型的有效性.(3)为了减少(2)中所给优化模型的变元个数,在给定加权轴下,通过引入升维映射,将模型求解转化为线性分类问题,并通过遗传算法优化加权轴的取值,从而给出了一种解决(2)中优化模型的算法,使之可以处理更为复杂的数据分类.通过实验数据表明所给分类算法的有效性.
其他文献
伴随着科技的进步,汽车制造业除了提升车辆的舒适性、操控性和车辆本身的安全性能外,越来越多的公司已经开展了对自动驾驶技术的研究。相比于目前雷达在环境感知中对颜色信息
肝脏中Kupffer细胞所介导的炎症反应在非酒精性脂肪肝病发生的过程中具有重要的作用.通过肝脏切片的苏木精-伊红染色观察,发现清除肝脏中的Kupffer细胞能有效地改善由高脂饮
对茂名市14个主要公园观花乔木种类和应用现状进行了调查分析,结果表明:种植观花乔木共有40种,最多是苏木科植物,应用频度最高的树种是木棉Bombax ceiba,种植形式主要有丛植
目的通过建立早产大鼠认知障碍模型,提取各组大鼠粪便进行16S r RNA测序,分析比较各组大鼠肠道菌群结构特征;收集大鼠血液,检测各组大鼠血清5-羟色胺(5-Hydroxytryptamine,5-
在经济新常态发展背景下,我国城镇化发展从资源、要素、产业向城镇集中的1.0时代以及城市病开始显现的2.0时代迈向城市功能3.0时代。特色小镇这一新兴概念作为推动新型城镇化
本文对张岱研究中两个重要悬案进行了严密的考辨 :一是关于卒年。张氏卒年 ,向有“69岁”、“70余岁”、“93岁”诸说 ,本文通过对大量第一手材料的比勘、互证 ,并运用张岱手
随着新课程改革的不断发展,提升学生的核心素养就成了主要内容,这就需要教师在教学的过程中掌握科学的方法提高学生对数学的兴趣,尤其是小学数学教学,教师更要找到适合学生的
"异面直线所成角"看上去很简单,但教学处理不应简单化.通过"异面直线所成角"教学片断及设计意图的展示说明,应根据教学的多维目标,有机整合和利用教材资源,使它发挥应有的育
在频谱资源日渐稀缺的背景下,毫米波通信已成为解决5G及之后大带宽通信需求的基本途径,也是当前学术界和工业界关注的热点方向。由于波长短,毫米波往往与大规模天线技术相结
中职学生在学习SQL语句时,选择在Access和SQL server这两种数据库软件练习时,两种软件在实现SQL查询功能时有相同处和不同处。