基于ABC—LSSVM的芹菜总黄酮提取量预测

来源 :江苏农业科学 | 被引量 : 0次 | 上传用户:jiangbaolin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对传统的芹菜总黄酮含量测定过程复杂、时间长的问题,提出一种基于人工蜂群算法(ABC)优化最小二乘支持向量机(LSSVM)的芹菜总黄酮提取量预测方法。首先对标准人工蜂群算法进行改进,然后利用改进的人工蜂群算法对最小二乘支持向量机的核宽度和正规化参数进行寻优,最后对芹菜总黄酮的提取量进行预测。结果表明,该方法具有预测精度高、性能稳定的特点,有利于实现芹菜总黄酮提取量的网络在线预估和优化控制。
  关键词:人工蜂群算法;最小二乘支持向量机;总黄酮;预测;芹菜
  中图分类号: S126文献标志码: A文章编号:1002-1302(2015)01-0298-03
  收稿日期:2014-09-25
  基金项目:四川理工学院科研项目(编号:2013KY04);酿酒生物技术及应用四川省重点实验室开放基金(编号:NJ2011-09)。
  作者简介:曾燕(1979—),女,四川自贡人,硕士,讲师,研究方向为人工智能。E-mail:zy261365@suse.edu.cn。芹菜是1年生或2年生的伞型花科植物,在15世纪被作为药食两用栽培植物引入中国。现代医学研究发现,芹菜茎、叶中含有丰富的黄酮类物质,具有清除自由基、抗氧化、抑菌、抗病毒、抗癌、抗肿瘤作用,对心血管疾病和肝病也有一定疗效[1-2]。从芹菜中提取黄酮类物质,生产具有抗氧化作用的天然保健产品,已成为农产品资源高效利用的研究热点[3-4]。
  目前测定芹菜总黄酮提取量大多采用分光光度法、光谱法等方法,测定过程复杂、时间长、成本较高[5]。采用软件方法实现芹菜总黄酮提取量预测,是解决此类生物量参数难以实时在线测量和控制的有效方法[6]。近年来神经网络、支持向量机等预测技术越来越受到重视[7-8],其中神经网络技术对样本数据量要求高,应用受限;支持向量机预测技术虽然适用于非线性小样本数据,但其泛化能力有限,对异常样本敏感,在实际应用中容易出现大的预测偏差。最小二乘支持向量机技术提高了泛化能力,具有精度高、性能稳定的优点,可用于农业现代化应用中[9]。影响最小二乘支持向量机预测精度的重要参数指标是正规化参数和核宽度系数,传统的交叉验证确定法可保证较高的预测精度,但预测速度慢,限制了其实际应用。本研究采用改进的人工蜂群算法对最小二乘支持向量机的参数指标进行优化选择[10-11],避免了标准人工蜂群算法过早收敛问题,实现了芹菜总黄酮提取量的快速预测,以期对蔬菜黄酮类物质提取量的在线测量提供参考。
  1算法基础
  1.1最小二乘支持向量机
  最小二乘支持向量机(LSSVM )对支持向量机(SVM)进行了改进,很好地解决了小样本、非线性、高维数的问题,提高了问题的求解速度和泛化能力。最小二乘支持向量机通过构建如下回归函数,将非线性问题转化为高维特征空间的线性估计问题。
  f(x)=ωTφ(x) b。(1)
  式中:φ(x)是核空间映射函数;ω为权值向量;b为偏置量。
  最小二乘支持向量回归算法就是求解如下约束优化问题。
  minJ(ωξ)=12ωTω 12γ∑ni=1ξ2i;(2)
  s.t. yi=ωTφ(xi) b ξi,i=1,2,…,n。(3)
  式中:ξi为第i个样本真实值与预测值的误差;γ为可以动态调整的正规化参数。
  可采用拉格朗日函数求解这个优化问题。
  L(ω,β,ξ,α)=12ωTω 12γ∑ni=1ξ2i-∑ni=1αi[ωφ(xi) b ξi-yi]。(4)
  式中:αi∈R(i=1,2,…,N)为Lagrange乘子。a和b的求解与核函数的选择有关,常选择如下形式的径向基核函数(RBF)。
  K(xi,xj)=exp-|xi-xj|22σ2。(5)
  式中:σ为核宽度。
  由此可见,对于最小二乘支持向量机,核宽度σ和正规化参数γ是2个重要参数,它们的选取直接影响着算法的学习能力和泛化性能。
  1.2人工蜂群算法的改进
  人工蜂群算法(ABC) 模拟蜜蜂群智能搜索行为,具有控制参数少、算法简单等优点,受到国内外学者广泛关注。但是标准ABC算法局部搜索能力较差,容易产生早熟和停滞现象[11]。
  改进标准ABC算法的随机初始化种群生成方式,采用反向学习[12]的初始化策略,确保初始种群的多样性,可以提高求解效率和改善解的质量。
  首先,随机生成初始解集{xij|xij∈[minj,maxj]}、(i,j分别为解的个数和维度,minj,maxj分别为第j维的下界、上界)。然后,对每个初始解求出对应的反向解,计算方法如下。
  xij=minj maxj-xij。(6)
  最后,对随机种群和反向种群的合集进行排序,选择适应度较优的解作为初始种群。
  在标准ABC算法中,跟随蜂根据雇佣蜂种群适应度大小,按照轮盘赌策略选择1个雇佣蜂跟随,易导致群体多样性下降,算法过早收敛。采用“信息素-灵敏度”模型代替轮盘赌选择策略[11]。
  信息素反映了解的质量,信息素的大小与目标函数值呈正比,每完成1次搜索过程,信息素进行动态更新。灵敏度确定搜索的区域方向。信息素和灵敏度相结合的方法如下。
  p(i)=f(i)-fminfmax-fminfnax≠fmin
  0p(k)≤s(i)。(7)
  式中: f(i)为个体的适应度值;fmax,fmin为最大适应度值和最小适应度值;p(k)为不等于i的第k个食物源的信息素;s(i)为第i个跟随蜂的灵敏度:s(i)~U(0,1)。
  “信息素-灵敏度”模型在一定程度上避免了算法陷入局部最优,保证了算法快速进化的方向。   2预测建模
  2.1芹菜总黄酮成分提取和测量方法
  对于芹菜总黄酮的提取,首先将芹菜原料进行低温烘干,以降低机械粉碎的强度。将其粉碎后,称取芹菜干粉1 g于50 mL锥形瓶中,加入一定量乙醇浸泡,从而使有效成分充分溶解。然后将浸泡好的溶液投入超声波提取器提取,之后抽滤、定容,作为测定总黄酮含量的待测液,最后测定总黄酮含量。芹菜总黄酮的提取工艺流程如图1所示。
  采用Al(NO3)3-NaNO2分光光度方法[4] 测定总黄酮含量。取上述样品液2 mL,用30%乙醇溶液定容至5 mL,加入15% NaNO2溶液0.3 mL,摇匀静置6 min,再加入10%Al(NO3)3 溶液0.3 mL,摇匀静置6 min后加入1 mol/L NaOH 溶液4 mL,再用蒸馏水定容,摇匀静置15 min后测定吸光度,根据吸光度计算样品液中总黄酮含量。由此可见,芹菜总黄酮提取测定过程复杂、时间长。
  2.2基于ABC-LSSVM的芹菜总黄酮提取量预测模型
  采用吸光度方法测定芹菜总黄酮提取量,由于测定过程复杂、时间长,制约了其生产应用。因此,构建芹菜总黄酮提取含量的预测模型,减少试验测量次数,实现在线实时预测尤为必要。基于ABC-LSSVM的芹菜总黄酮预测步骤如下:(1)对芹菜总黄酮提取试验中的相关数据进行归一化处理;(2)参数初始化,设置最大迭代次数,按反向学习策略生成初始解,计算适应度函数值;按适应度函数值优劣进行排序,排在前50%的为雇佣蜂,排在后50%的为跟随蜂;(3)对于第n步的雇佣蜂,记录最优值并展开邻域搜索,产生1个新位置;(4)雇佣蜂按贪婪选择方法,当搜索解优于记忆中的最优解时,替换记忆解,反之保持不变;(5)全部雇佣蜂完成邻域搜索后,跳摆尾舞与跟随蜂共享食物源信息;跟随蜂按公式(7)的选择机制选择雇佣蜂;(6)同(3)(4),跟随蜂记下种群最终更新后达到的最优适应度值以及相应的参数; (7)当跟随蜂的邻域搜索次数到达阀值而仍未找到更优位置时,侦察蜂重新初始化食物源位置;(8)如果满足停止准则,则停止计算,输出最优适应度值及相应参数,否则转向(3);(9)根据最优解得到的LSSVM参数对测试数据集进行仿真,用建立的芹菜总黄酮预测模型对总黄酮提取量进行预测。
  3结果与分析
  根据芹菜总黄酮提取试验,发现总黄酮提取量主要与提取时间、乙醇浓度、料液比等3个非线性因素的关系最为密切,三者之间的交互作用较小,且容易测量。因此,在5种料液比(1 ∶10、1 ∶20、1 ∶30、1 ∶40、1 ∶50, g ∶mL)、5种乙醇浓度水平(50%、60%、70%、80%、90%)、5种提取时间(10、20、30、40、50 min)条件下进行芹菜总黄酮提取的单因素试验。
  在单因素试验基础上,选用L9(33)正交试验表,考察料液比、提取时间、乙醇浓度对芹菜总黄酮提取的影响。因素水平见表1。
  表1芹菜总黄酮提取条件正交试验因素与水平
  水平因素提取时间(min)乙醇浓度(%)料液比(g ∶mL)130701 ∶20240801 ∶30350901 ∶40
  将试验所得的24例数据作为样本数据,在数据归一化之后,选取前16例试验样本数据作为训练样本数据,构建基于ABC-LSSVM的预测模型,再用后11例样本数据作为测试数据,对该模型进行验证。作为训练样本的16例原始数据如表2所示。
  表2芹菜总黄酮预测模型训练样本数据
  样品编号提取时间
  (min)乙醇浓度
  (%)料液比
  (g ∶mL)总黄酮含量
  (mg/g)140701 ∶106.472240701 ∶206.938340701 ∶307.296440701 ∶406.902540701 ∶506.830610701 ∶306.186720701 ∶306.400830701 ∶306.651940701 ∶306.9731050701 ∶306.9381140501 ∶304.2871240601 ∶305.2901340701 ∶306.5441440801 ∶307.4751540901 ∶307.1531640701 ∶206.207
  在预测仿真试验中,计算机配置为联想双核E5800@3.2 GHz、2 G内存、Windows XP 操作系统,测试软件采用Matlab 7.0。
  采用改进的人工蜂群算法优化最小二乘支持向量机得到的最优化参数值为:核宽度σ=262.22,正规化参数 γ=1 969.6。将基于ABC-LSSVM预测模型仿真得到的数据与实际测量数据进行比较,结果见表3。
  表3基于ABC-LSSVM的芹菜总黄酮预测结果
  样品
  编号提取时间
  (min)乙醇浓度
  (%)料液比
  (g ∶mL)实测含量
  (mg/g)预测含量
  (mg/g)相对误差
  (%)140801 ∶307.486.95-7.08240901 ∶307.157.180.36330701 ∶206.286.564.50440801 ∶206.496.825.09550901 ∶206.607.087.23630801 ∶306.966.92-0.55740901 ∶307.217.18-0.43850701 ∶306.466.744.28930901 ∶407.077.212.031040701 ∶406.676.771.521150801 ∶407.357.03-4.37
  由表3可知,采用ABC-LSSVM的芹菜总黄酮预测模型得到的仿真数据与实测数据的最大相对误差为7.23%,最小相对误差为0.36%,平均相对误差为1.14%,精度较高。实测数据与仿真数据的对比如图2所示。   图3更直观地描述了模型估计值与实测值的相对误差情况。基于ABC-LSSVM的芹菜总黄酮提取量预测模型的进化曲线如图4所示,由图4可见,该预测模型收敛速度快、精度高、性能稳定。
  4结论
  芹菜总黄酮提取受提取时间、乙醇浓度、料液比等3种非线性因素的影响,可利用改进的人工蜂群算法优化最小二乘支持向量机建立芹菜总黄酮预测模型。在标准人工蜂群算法的种群初始化阶段,引入反向学习策略,确保了个体分布的均匀性,并用“信息素-灵敏度”模型作为选择策略,提高了预
  测的精度和收敛速度,性能稳定,对于芹菜总黄酮提取的网络在线估计、降低测定成本具有重要意义。
  参考文献:
  [1]赵进,尤婷婷,林丹英,等. 超声波提取芹菜总黄酮及鉴别[J]. 时珍国医国药,2007,18(6):1454-1455.
  [2]文开新,王成章,严学兵,等. 黄酮类化合物生物学活性研究进展[J]. 草业科学,2010,27(6):115-122.
  [3]包丽芹,韩德权. 芹菜及芹菜黄酮的药用价值[J]. 黑龙江医药,2007,20(4):317-320.
  [4]陈欲云,刘春丽,边名鸿. 芹菜黄酮抗氧化作用的研究[J]. 时珍国医国药,2012,23(7):1718-1719.
  [5]何书美,乔兰侠,刘敬兰. 红外光谱法测定芹菜叶提取物中总黄酮的含量[J]. 分析科学学报,2008,24(2):201-204.
  [6]俞金寿. 软测量技术及其应用[J]. 自动化仪表,2008,29(1):1-7.
  [7]王红君,张梦,赵辉,等. 基于 BP 神经网络的温室黄瓜灌溉预测模型[J]. 江苏农业科学,2013,41(11):407-409.
  [8]赵辰阳,徐明. 基于 FIG -SVM 的农产品价格趋势预测[J]. 江苏农业科学,2014,42(5):385-388.
  [9]杨玮,孙红,郑立华,等. 基于土壤参数的冬小麦产量预测模型[J]. 农业工程学报,2013,29(23):118-123.
  [10]朱林,陆春伟.基于改进蚁群支持向量机的氢含量软测量建模[J]. 计算机仿真,2014,31(3):384-388.
  [11]王慧颖,刘建军,王全洲. 改进的人工蜂群算法在函数优化问题中的应用[J]. 计算机工程与应用,2012,48(19):36-39.
  [12]汪慎文,丁立新,谢大同, 等. 应用反向学习策略的群搜索优化算法[J]. 计算机科学,2012,39(9):183-187. 谢雨杉,李多伟,李银芳,等. 碘试液比色法测定α-淀粉酶抑制剂活性[J]. 江苏农业科学,2015,43(1):301-303.
其他文献
是否在欢聚时刻众多菜品不知吃些什么?是否在闲暇时光各种零食不知如何选择?在美食面前,你是否也选择困难?这里,你将感受到中华民族饮食文化的博大精深……嘿,擦一擦口水!  夕颜的花语是永恒的爱恋,正如我对美食的深深执念。一个有情怀的吃(胖)货(子),一个很怀(做)旧(作)的写手,心中常有诗酒茶,步履生风闯天涯。  小时候家里住乡下,听奶奶讲,在以前穷苦的岁月里,像大米这种细粮是吃不到的,因此,适合在东
摘要:通过了解紫红龙在不同温度条件下的生理特征,为延长其贮藏期限提供依据,以模拟常温(25±0.5) ℃和低温(5±0.5) ℃贮藏的紫红龙为试验材料,研究其采后在不同贮藏环境中可溶性蛋白质含量、抗氧化酶[超氧化物歧化酶(SOD)、过氧化物酶(POD)、过氧化氢酶(CAT)]活性、丙二醛(MDA)含量和抗超氧阴离子(O-2·)活力等生理指标的变化。结果表明:低温比常温减缓了紫红龙果实可溶性蛋白质的
摘要:为研究不同种类杀菌剂对葡萄致腐病菌的室内抑菌活性,采用菌丝生长速率法,测定了18种生产中常用的杀菌剂对6种葡萄致腐病菌的室内毒力,以筛选出适合防治葡萄致腐病菌的杀菌剂。结果表明,18种杀菌剂对病原菌均具有一定的毒力,不同病原菌对杀菌剂的敏感性存在差异。己唑醇、氟硅唑、烯唑醇的抑菌能力较强,其EC50分别介于0.042~4.11、0.068~19.82、0.20~11.46 mg/L。多菌灵对
摘要:综合土地利用、DEM、POI、社会经济等多源数据探索南方低山丘陵区乡村类型定量识别方法,为编制区域乡村振兴规划、分类推进乡村发展提供参考。在简要归纳乡村发展要素的基础上,构建乡村发展水平评价指标体系,定量评价2018年江西省万年县乡村综合发展水平,并借助灰色星座聚类模型和质性归纳法识别其乡村发展类型,进而提出不同类型乡村差异化振兴策略。结果表明,万年县乡村综合发展水平整体不高,呈现出“东南高
摘要:纤维素是自然界中分布最广泛的一种生物质能源,筛选能够高效降解纤维素的菌株对于开发利用这类物质具有重要意义。从土壤中分离纯化获得一株高产纤维素酶的菌株TW063-3,通过形态学结合分子生物学鉴定得出,该菌株为草酸青霉。通过单因素优化试验寻找最佳培养条件,然后通过正交试验确定关键因子的最佳参数。筛选得出最佳培养条件:15 g/L羧甲基纤维素钠 2 g/L硝酸铵,pH值为3.0,200 r/min
一  李桦笔名浪沙、白浪沙,斋号滴泉斋,是中国20世纪最有影响力的版画艺术家之一。李桦先生1907年出生于广东省番禺县,青年时期的李桦天资聪颖、酷爱艺术,曾留学日本学习西方印象主义绘画。九一八事变后,他立即回国投身到“反日救国”的爱国运动之中。    20世纪30年代的中国饱受列强的凌辱,山河破碎,风雨飘摇。残酷的现实社会强烈地刺激着青年时期的李桦,受当时苏联进步思潮的影响和鲁迅先生“当革命时,版
晚清时期,东方中国的神秘感在西方社会中依然存在,陶瓷和茶叶等传统出口商品依然深受西洋人的青睐。但他们对东方古国的求知诉求却悄然发生了改变—除了生活消费之外,他们似乎对中国的文化、社会和生活的感兴趣程度在不断增强。正如《点石斋画报》中充满了中国人对西洋文明、传统与科技的想象,西方人也希望寻求一种渠道,去赏析东方文明。那是一个摄影术尚未真正流行的时代,绘画依然是各种文明之间交互往来、增进直观感知的重要
摘要:以猪粪为原料,采用水热炭化法制备水热炭,考察炭化温度(140~220 ℃)和时间(1~9 h)对水热炭性质的影响。结果表明,猪粪水热炭产率在53.5%~97.35%,当温度从140 ℃增加到220 ℃时,水热炭中C含量增加了8.94%,N、S、H含量变化较小,而O含量减少了17.57%。H/C、O/C和(O N)/C原子比分别减少了0.02%、0.44%和0.46%;C/N增加了1.14%,
要了解一个死去已经一千年的人,并不困难。试想,通常要了解与我们同住在一个城市的居民,或是了解一位市长的生活,实在嫌所知不足,要了解一个古人,不是有时反倒容易吗?姑就一端而论,现今仍然在世的人,他的生活尚未完结,一旦遇有危机来临,谁也不知道他会如何行动。醉汉会戒酒自新,教会中的圣人会堕落,牧师会和唱诗班的少女私奔。活着的人总会有好多可能的改变。还有,活着的人总有些秘密,他那些秘密之中最精彩的,往往在
摘要:利用2010年中国家庭动态跟踪调查(CFPS)数据,将收入冲击和社会资本变量纳入统一框架下研究农户的消费信贷行为。结果发现,当前农户主要依靠非正规金融途径获得消费信贷,信贷资金主要用于家庭的住房改善、医疗、日常开支及教育方面。农户在收入遭受冲击时消费信贷需求更为强烈,社会资本提高了农户消费信贷的可获性及信贷额,不同类型社会资本对农户获得正规金融机构或非正规金融渠道的消费信贷的影响并不一致,家