基于改进隶属度函数的模糊支持向量机及其应用研究

来源 :赣南师范大学 | 被引量 : 0次 | 上传用户:laoyoutiaosc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support vector machine,SVM)算法发展至今,已经成为机器学习领域内的经典算法。SVM主要有以下几个显著优点:首先,以统计学习理论为基础,运用结构风险最小化原则克服过拟合问题,从而有效提高了算法的鲁棒性。其次,通过引入核函数来解决因数据映射到高维特征空间产生的维数灾难问题。最后,为了避免在求解的过程中陷入局部最优,通过解一个凸二次规划问题得到全局最优解。SVM目前广泛应用于自然语言处理、模式识别等领域。虽然SVM在理论和应用上都表现了突出的优势,然而样本中噪声或离群点的存在影响了SVM的分类性能。为了解决SVM算法对噪声或离群点敏感的问题,研究人员提出了模糊支持向量机(Fuzzy support vector machine,FSVM)算法。根据各样本对最优分类超平面的构建所起作用的不同赋予不同的隶属度值,从而降低噪声或离群点对分类性能的影响。目前关于如何确定及选择合适的隶属度函数没有一个统一的准则,因此隶属度函数的设计是FSVM算法研究的重点和难点。随着互联网的普及和大数据时代的到来,各行各业的数据和信息正以史无前例的速度产生,农业领域也不例外。信息的大幅增加对于用户而言有利有弊,一方面大大便利了用户获取信息的方式,另一方面从大量的信息中得到有效信息的难度也越来越大。由此可见,合理有效地对这些农业信息进行分类管理十分重要,农业文本分类成为农业信息化领域研究的重要问题。本文以中文农业文本分类研究为背景,对FSVM算法进行了深入地研究,重点研究了如何改进现有的FSVM算法,从而提升中文农业文本分类的效果。工作内容主要包括如下几个方面:1.系统归纳总结了SVM和FSVM的相关理论和算法,主要包括模型的产生、推广和演变等。并综述了几种常见隶属度函数的设计思路与方法。2.提出了一种基于中心核对齐的隶属度函数构造方法,进而构造了一种基于中心核对齐的FSVM模型。通过实验对比各种相关算法的性能,结果表明了该算法的有效性。3.提出了一种基于双重特征加权的FSVM模型,该模型将得到的特征权重分别应用到隶属度函数和核函数的计算中,能有效降低弱相关或不相关特征的影响。实验结果表明该模型具有很好的泛化性能。4.针对中文农业文本分类的特点,在对其进行分类之前,进行了文本的获取、预处理、特征处理和文本表示等操作。将本文提出的两种改进的FSVM算法应用到中文农业文本分类中,并与相关的SVM和FSVM算法进行对比分析,实验结果验证了本文提出的两种算法在中文农业文本分类中的有效性。
其他文献
复杂系统维修资源优化的智能化无疑是当前和今后非常有潜力的发展方向,对提升维修资源配置的最终效果具有不可估量的作用。装备维修备件作为一种重要的维修资源,它不仅影响着装备修复的及时性,而且也是影响装备维修保障效能和保障费用的重要因素。维修备件的库存管理成为装备维修保障工作中经费投入最大的方面之一。因此,针对多品种备品备件的库存决策优化模型与算法的研究具有重要的意义。本文根据装备保障实践,研究了装备维修
研究表明,肉鸭饲粮中添加硫酸亚铁可以改善其生长性能及肠道发育,而有机铁源甘氨酸亚铁具有化学结构稳定、生物效价高等诸多优点,其添加效果可能更佳。然而目前关于饲粮中添加甘氨酸亚铁对肉鸭生长性能、胴体品质和肠道健康的影响尚不清楚。因此,为探究饲粮中添加不同水平甘氨酸亚铁对肉鸭生产性能及肠道发育与健康的影响,选择672只1日龄樱桃谷肉鸭按照体重无差异原则分为6组,分别饲喂添加量为0(基础组)、30、60、
水分胁迫是一种常见的植被胁迫状态,在以往基于植被指数的植被水分胁迫监测研究中,鲜少有关于植被水分胁迫早期探测的研究。水分胁迫是影响植物光合作用的最主要环境因素之一,而叶绿素荧光(Solar-Induced chlorophyll Fluorescence,SIF)被认为是探测植被光合功能受植物生理状态及环境条件影响的敏感“探针”,基于叶绿素荧光在植物的胁迫状况及光合功能状态的早期诊断方面具有巨大潜
肉鸭肝脏具有独特的脂肪积累能力使得脂肪易在其肝脏组织中大量沉积,可能引起肉鸭肝脏的损伤,损害肉鸭的健康并降低生产性能;研究表明,甘氨酸锌(glycine,Zn Gly)可有效降低脂质代谢相关疾病的发生率,且作用效果优于硫酸锌(Zn SO4);因此,本研究通过两个动物试验探索Zn Gly对肉鸭肝脏脂质代谢和肝脏损伤的影响及机理;试验一饲粮Zn Gly水平对肉鸭肝脏脂肪沉积和肝脏损伤的影响采用单因素试
研究目的:筛选并鉴定出可交联调控头颈部鳞状细胞癌(Head and Neck Squamous Cell Carcinoma,HNSCC)肿瘤耐药和肿瘤免疫的关键基因,并初步验证其功能。研究方法:先通过药敏实验联合CRISPR/Cas9文库技术,筛选获得顺铂耐药的Fa Du细胞,再提取细胞DNA进行全基因组测序,得到顺铂耐药基因。再通过生物信息学手段,以TCGA数据库中HNSCC标本的m RNA数
随着智能手机的普及和互联网技术的快速发展,视频媒介成为一种越来越普遍的信息传播方式,短视频成为了目前流行的大众娱乐方式。随之而来,短视频营销也成为了品牌营销的重要阵地。目前本人所在公司(下文简称B公司)的短视频营销业务存在着创意难和制作麻烦的问题。营销人员常常缺乏足够的创意想法,并且很难熟练使用各种复杂的计算机视频制作软件。为解决这些问题,本文设计并实现了一款营销类短视频制作应用,该应用具有营销案
随着物联网、车联网和5G等技术的不断发展,虚拟现实、增强现实、智能家居、智能电网和无人驾驶汽车等新型应用层出不穷。这些应用都需要更强的计算能力、更高的带宽和更低的时延,并且这些新型应用会产生较高的能耗。由于用户设备上的资源是受限的,很难达到新型应用在时延和能耗上的需求。移动边缘计算(Mobile Edge Computing,MEC)将服务器配置在基站侧,为周边用户提供计算和存储服务,有效的缓解设
降水相态是指地面降水的形态,可分为雨、雪、冻雨、雨夹雪等多种类型。传统的观测方式是在观测站点以人工观测为主,在无地面观测的区域难以获得其天气实况。但地面降水相态对人类生活生产有重大影响,如在无人区中冻雨导致的电线结冰等现象。所以在缺乏地面观测的情况下如何精准获得降水相态实况是亟需解决的气象问题之一。降水相态受高空温度、湿度、风力、风向等廓线的影响,成因比较复杂。本文利用数值模式预报的中高空气象要素
量子身份认证能够实现量子通信中的身份验证过程,保证了通信方身份的真实性。与经典身份认证协议相比,量子身份认证安全性由量子不可测量原理和不可克隆定理等量子力学特性所保证,具有较高的安全性。纠缠态量子身份认证协议面临制备困难、储存困难和纠缠特性维持困难等问题,单光子具有制备容易、性能稳定、实现过程简单的特点。本文以单光子作为信息载体,提出了高效的量子身份认证协议、测量设备无关的量子身份认证协议和免疫集
随着物联网的快速发展和普及,资源受限的物联网设备如电子标签、无线传感器等部署领域也越来越广泛,保障这些设备信息安全的轻量级分组密码的设计与实现成为当前非常重要的一个研究热点。本文致力于面向体系结构的轻量级分组密码研究与实现,重点研究面向体系结构的轻量级分组密码硬件优化实现方法,结合最小化电路、最短路径、最佳共享等技术对PRINCE算法部件以及硬件体系结构进行优化,同时利用比特切片技术提出一种新的基