基于非负矩阵分解的回归模型应用—以影响碧螺春产量的气象因子分析为例

来源 :苏州科技学院 苏州科技大学 | 被引量 : 0次 | 上传用户:catloveless
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非负矩阵分解(NMF)是基于部分表示整体的一种方法,由于其得到的因子矩阵具有元素非负性,故其分解结果具有物理意义。NMF为人们处理大规模数据问题提供了一种新途径,其简便性及其结果的可解释性使得其应用涵盖自然科学和社会科学的每个领域,主要被运用于图像处理和数据压缩等方面。  本文首先介绍了非负矩阵分解和主成分回归理论及其算法原理,依据访谈调研、文献资料并结合多元线性回归分析,对碧螺春茶采摘期时段气象因子与碧螺春茶产量的关系进行了初步的预测和分析。结果表明:碧螺春茶产量受到采摘期时段均温、降水量、光照等气象因子的影响,其中均温对产量的影响最大,降水量和光照对产量的影响程度相当。初步探索后,选定均温、降水量和光照为建立模型的变量。其次,利用苏州市吴中区东山镇1995年至2013年的气象数据和碧螺春产量数据为基础,将数据分为分为训练数据和检验数据两部分。遵循利用训练数据建立模型,利用检验数据验证模型的建模的准则,分别建立了碧螺春茶产量与气象因子(均温、降水量和光照)之间的主成分回归模型和一类基于非负矩阵分解的回归模型。最后,结合主成分回归和基于非负矩阵分解的回归预测结果,对两种方法进行了对比,得出以下结论:首先,针对本文研究的气象因子与碧螺春产量关系,基于非负矩阵分解模型的预测效果优于主成分回归模型的预测效果;其次,基于非负矩阵分解方法的模型直接反映出原始变量和因变量的关系,而主成分回归反映的是组合因子与因变量的关系;另外,主成分回归的计算过程较前者更为复杂。由于对矩阵非负分解的不唯一性,其建立的模型和结果均不唯一。因此,就本文研究的结果而言,基于非负矩阵分解的回归模型是优于主成分回归的。
其他文献
在本文中,我们主要研究了两个等待制服务台的串联排队系统模型。针对输入过程为泊松分布,两个服务台的服务时间都服从指数分布的特殊模型,前人已经根据生灭过程理论得到了队
分岔普遍地存在于自然界中,意味着依赖于参数的系统当参数在一个特定值附近作微小变动时,它的某些性质发生本质变化。近十几年来,鉴于分岔理论在力学、物理学、生物学、化学及一
与其它类型算法相比,变分不等式的投影算法构造简洁.因此该算法被研究变分不等式算法的学者深入而细致地讨论.但早期投影算法的收敛性证明通常要求变分不等式中的映射是强单调和
本研究在磁性杂质存在的条件下来描述BPS涡旋动力学。在一个双周期区域和全平面上分别给出了一系列磁性杂质模型中多重涡旋解的存在性,唯一性定理。主要运用变分方法和不动点
随着计算机和信息技术的快速发展,人们需要花费昂贵的代价收集、存储和处理海量的数据。如何从中发现有用的信息,已经成为一个迫切需要解决的问题,数据挖掘技术在这种背景下
近些年来,人们渐渐发现分数阶导数在许多科学领域中发挥了越来越重要的作用,特别在工程,物理,金融,水文等领域。分数阶的微分方程证明对于模拟许多物理现象是一个很有用的数学工具