基于Tensorflow改进支持向量机分类算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jiu_yue9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机处理能力的增强,信息化产生大量的数据。机器学习通过对大量数据学习得到解决各种问题的方式。Tensorflow拥有不同的优化算法,提供计算空间,适用于各种机器学习任务。在机器学习中一项主要任务是处理分类问题。支持向量分类算法是机器学习中经典分类算法,在支持向量机分类问题中,处于分离平面较近的样本决定最终分割平面,这些样本被称做“支持向量”,最终预测模型的表达式与“支持向量”有关。由于样本量大导致求解复杂度高,在训练之前保存可能的“支持向量”缩减样本集,可以缩短求解时间。支持向量机与神经网络都具有非线性逼近特性,但神经网络容易陷入局部极优,如何结合两者来提高网络预测准确率。基于上述背景,本文研究内容如下:(1)针对支持向量机分类算法因样本量大而导致求解复杂度高的问题,提出利用K近邻样本的周边概率来缩减样本集,保留那些可能的“支持向量”样本,剔除非支持向量样本缩减数据集。在支持向量机求解问题上,原始问题和对偶问题在计算速率上有明显差异,当样本集数量较大时,对偶问题求解复杂度较高,速率较低,这种情况下对原问题求解比较合适。本文使用Tensorflow框架完成对支持向量分类算法原问题和对偶问题的求解,利用网格搜索寻找支持向量机最佳超参数。首先验证使用K近邻样本周边概率来缩减数据集的有效性,最后在UCI数据集下,对比Tensorflow求解SVM与python库中SVM,部分数据集上取得较好准确率和F1。(2)在研究支持向量分类算法求解基础上,为了解决神经网络容易陷入局部极优、网络预测性能不稳定等问题,从神经网络与支持向量机区别出发,分析引起神经网络效果差的因素,引入先验知识,利用支持向量聚类的高斯特征作为先验特征来优化网络,由于神经网络受初始化影响易陷入局部极优,本文利用降噪自编码器来预训练获取网络的初始化权重,结合神经网络与支持向量机使用,发挥两者优势。首先对比降噪自编码器初始化网络权值与随机初始化网络权值对网络准确率和F1的影响,其次对比支持向量聚类的高斯核特征作为先验特征对网络性能的影响,最后在UCI数据集下,本文算法与常用分类算法(决策树、逻辑回归、神经网络、支持向量机)进行对比,大多数数据集上取得较好准确率和F1。
其他文献
本文在概括我国房地产现状及日本房地产泡沫发展规律的基础上,通过分析比较中日房地产发展过程中的各种表现及内部成因,从中得出保障我国房地产市场良性发展的建议。
"三因制宜"学说乃因时、因地、因人制宜,其传承了中医整体观念和辨证论治思想,指导临床合理用药。李宜瑞教授基于"三因制宜"学说结合岭南气候、岭南地域文化及岭南小儿体质特
我国加入世界贸易组织以来获得机遇的同时也面临着很多的挑战。如何增强自身的竞争能力就需要不断的引进和发展先进的物流理论和技术。我院的物流管理专业为了顺应市场需求,
本报讯(四川记者站羽欣白骅)连日来,作为灾后恢复重建先导产业的旅游业成为四川“两会”代表、委员热议和大众关注的焦点之一。建设地震遗址公园、加快景区和旅游设施建设、支持
报纸
在房屋征收过程中,完全补偿可以推动土地资源的有效配置、达到旧城改造中的帕累托最优、确保财产权得到平等的保护、降低征收过程的交易成本。以完全补偿为原则,将征收所涉及
采用合理的混炼、硫化、清洗等工艺路线,控制必要的温度、压力、生产时间等工艺参数,生产的卤化丁基橡胶塞符合国家食品药品监督管理局颁布的《注射用无菌粉末用卤化丁基橡胶
物流中心选址问题在物流规划中具有非常重要的地位,选址的合理与否直接关系到物流中心未来的发展。文章在分析物流中心选址方法的基础上,依据现代物流及城市规划原理,对盐城