快速增量式分类算法研究

被引量 : 8次 | 上传用户:milo999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据采集制作设备的日益普及,人们越来越方便地生产图像、图形、音频、视频、动画和三维模型等多媒体数据;随着互联网和海量存储技术的应用普及,人们在任何时候、任何地方都能够访问互联网上的多媒体数据。这些多媒体数据具有异构、非结构化、高维和动态变化等特征,给后续处理例如分类、聚类、挖掘、理解和利用带来巨大困难。本文主要针对互联网数据的特点,重点研究了高维数据的降维和海量数据的增量式分类方法。在高维数据降维研究方面,本文提出了基于非负矩阵分解的快速迭代方法,它利用数据的L1归一化特性和相关数据矩阵的稀疏性特点,设计了更加简洁的迭代更新规则。实验表明,该方法不仅可以实现快速降维,还能提升后续分类或聚类的精度。在海量数据分类研究方面,本文提出了免矩阵求逆的增量式学习方法,它针对近似支持向量机模型需要计算矩阵逆的问题,设计了不必计算矩阵逆的预测模型更新公式,实现了快速的增量式学习。实验表明,在预测精度基本不变的情况下,该方法能使时间复杂度降低一个数量级。进一步,在处理动态增加的海量数据分类方面,本文提出了增量式迁移学习方法,设计了一个适合样本加权的增量式模型并采用预测反馈机制对辅助数据上的模型进行调整,从而更能适应数据规模和分布上的动态变化。实验表明,该方法具有比非迁移学习方法“更快更好”的学习效果,并具有双向的迁移学习能力。综上,本文针对海量、高维、动态数据的分类问题,分别提出了关于降维和分类的快速算法,理论分析和实验评测表明,这些新算法具有更高的运行效率和更优的分类精度。
其他文献
化合物半导体材料GaAs 和InP 是微电子和光电子的基础材料。晶体中的位错会大大降低晶体的电学和光学性能。位错的产生归结于由温度梯度引起的热应力。采用有限单元法数值求
<正>有效课堂规则是营造良好课堂管理气氛的重要开端。20世纪20年代,国外就有学者提出,维持良好的课堂常规是"任何系统的教学技术的基础"。高效率的教师在学年的开始会花一定
当前,企业间相互拖欠货款现象相当普遍,应收账款居高不下,已经成为困扰企业经营活动的大问题。文章在分析企业应收账款回收及资金管理风险预警意义的基础上,探讨了预警指标构
我国现行行政复议管辖体制基本上是基于领导权而确定,这种"官本位"的行政级别管辖模式越来越遭到学者们的质疑和否定。行政复议管辖应该是源于监督权而不是领导权。在我国,借
期刊
在学习美国和欧洲(还有日本)的地面数字电视广播(DTTB)传输标准的基础上,针对地面数字电视广播快速移动接收的需求,提出:1)与制订地面数字电视广播新传输标准有关,在系统层设
随着我国经济的快速发展,我国企业实施走出去战略取得了显著的成就,但从目前进展情况来看,无论在政府层面还是在企业层面还存在着一些突出的问题。本文在分析中国企业实施走
“矩阵式”营销,也即以一个电影资源的根本核心点为“营销轴心”,然后以电影产业衍生出的其他产业环节为”营销矩面”,形成由点及面的立体电影营销方式,这种“矩阵式”营销主
<正> 北京卡酷动画卫视的前身是北京电视台动画频道,于2004年9月首播,经国家广电总局和北京市政府批准,2006年10月组建为北京卡酷动画卫星频道有限公司,2007年1月正式开始运