论文部分内容阅读
非负矩阵分解(NMF)是基于部分表示整体的一种方法,由于其得到的因子矩阵具有元素非负性,故其分解结果具有物理意义。NMF为人们处理大规模数据问题提供了一种新途径,其简便性及其结果的可解释性使得其应用涵盖自然科学和社会科学的每个领域,主要被运用于图像处理和数据压缩等方面。 本文首先介绍了非负矩阵分解和主成分回归理论及其算法原理,依据访谈调研、文献资料并结合多元线性回归分析,对碧螺春茶采摘期时段气象因子与碧螺春茶产量的关系进行了初步的预测和分析。结果表明:碧螺春茶产量受到采摘期时段均温、降水量、光照等气象因子的影响,其中均温对产量的影响最大,降水量和光照对产量的影响程度相当。初步探索后,选定均温、降水量和光照为建立模型的变量。其次,利用苏州市吴中区东山镇1995年至2013年的气象数据和碧螺春产量数据为基础,将数据分为分为训练数据和检验数据两部分。遵循利用训练数据建立模型,利用检验数据验证模型的建模的准则,分别建立了碧螺春茶产量与气象因子(均温、降水量和光照)之间的主成分回归模型和一类基于非负矩阵分解的回归模型。最后,结合主成分回归和基于非负矩阵分解的回归预测结果,对两种方法进行了对比,得出以下结论:首先,针对本文研究的气象因子与碧螺春产量关系,基于非负矩阵分解模型的预测效果优于主成分回归模型的预测效果;其次,基于非负矩阵分解方法的模型直接反映出原始变量和因变量的关系,而主成分回归反映的是组合因子与因变量的关系;另外,主成分回归的计算过程较前者更为复杂。由于对矩阵非负分解的不唯一性,其建立的模型和结果均不唯一。因此,就本文研究的结果而言,基于非负矩阵分解的回归模型是优于主成分回归的。