HSEC:基于聚类的启发式选择性集成

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:DirtySnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于聚类的启发式选择性集成学习算法.集成学习通过组合多个弱分类器获得比单一分类器更好的学习效果,把多个弱分类器提升为一个强分类器.理论上来说弱分类器的个数越多,组合的模型效果越好,但是随着弱分类器的增多,模型的训练时间和复杂度也随之递增.通过聚类的方法去除相似的弱分类器,一方面有效降低模型的复杂度,另一方面选出差异性较大的弱分类器作为候选集合.之后采用启发式的选择性集成算法,对弱分类器进行有效的组合,从而提升模型的分类性能.同时采用并行的集成策略,提高集成学习选取最优分类器子集效率,可以有效地减少
其他文献
本文首先运用Kolmgorov-Smirnov检验法对上证指数的走势进行了是否是正态分布的检验,然后运用统计过程控制原理对上证指数进行检测来发现投资机会和风险.最后验证该方法的有
和表面波器件相比,薄膜体声波谐振(FBAR)器件重量轻、尺寸小、成本低而且能够处理的功率大.因此,FBAR技术被认为是能够满足现代移动通信系统滤波要求的最有竞争力的技术.对FBAR器件进行模拟的方案中,Butterworth van Dyke(BVD)模型被广泛应用,但是它不可能被用于分析FBAR的复杂结构.为了准确模拟FBAR器件,必须用到数值方法,如有限元法(FEM)或者时域有限差分(FDTD
传声器阵列近场波束算法一般都以理想的声场模型进行参数优化,而理想模型在实际应用场景中会受到较大的干扰。本文通过房间声场模型分析阵列在近场的干扰分布,并讨论不同的干扰
移动时间层次聚类(Travel-Time based Hierarchical Clustering,TTHC)是一种新的势能聚类算法,尽管具有较好的聚类效果,但是该算法需要人工设定聚类数目,而且在分配样本的时
本文在重新选择回归数据时期的基础上,通过二分值因变量模型,对我国上市的财务困境作了实证研究,得出的结论在预测的准确率上与多数学者的结论相差甚远.作者对此提出了看法,
文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,
2002年全国金融工作会议再次强调:必须把银行办成现代金融企业,把国有独资商业银行改造成治理结构完善,运行机制健全,经营目标明确,财务状况良好,具有较强国际竞争力的现代大
部队资金,是由军费转化,并为部队各级所拥有,在一定行为规范下直接保障于部队战备、训练和人员生活必需的单位财力.部队资金控制,是按照规定的程序和内容,对单位所有的一切财
车型识别分类,对低/高速行车道划分、流量统计,特别是超长/重、危险品车的识别具有现实意义.实验室曾提出的基于尺度不变特征转换SIFT、方向梯度直方图HoG视频检测方法抗干扰能力弱,在因道路环境差、网络拥塞随机造成图像模糊时,往往误判.为此,在机理上,分析比较了上述分类算法与特征白化、稀疏编码算法的局限或优势,提出了适应低清晰度视频的"白化-稀疏特征"车型分类算法.该分类算法采取PCA白化技术特征数