论文部分内容阅读
马匹体重是反映与衡量其健康状况的重要指标之一,并在马匹选育、肉质评价、饲养管理、马匹鉴定等方面具有重要参考意义,然而伊犁马体型高大,性情活泼且长时间处于野外放养状态,这就造成伊犁马称重困难现象。本文在通用性马匹体重估测模型基础上,阐述并实现多种针对伊犁马品种的体重估测模型,并将这些体重估测模型嵌入软件系统中,以方便用户使用伊犁马体重估测模型。
本研究数据主要来源于新疆伊犁地区昭苏县,该地区是伊犁马的中心产区之一。本文研究对象为两岁左右的伊犁马,主要采集马匹年龄、性别、胸围、体长、体高、管围和体重信息,通过对采集数据分析与筛选,确定了与体重信息相关性密切的胸围、体长和体高作为模型特征参数。根据机器学习模型选择路线,先选定并实现多个典型线性回归模型,为了更好地提高模型估测效果,尝试选择并实现多个非典型线性回归模型,进而为之后两个集成模型的构建奠定了基础,最后尝试建立神经网络模型以求更加优秀的估测效果。系统开发遵循软件工程规范,完成了系统前期的分析与设计,系统中期的开发与调试,系统后期的实现及测试。
研究主要成果可分为以下五个部分:
(1)在伊犁马体重估测模型中,实现典型的机器学习线性回归模型,包括:最小二乘法线性回归模型,岭回归模型,套索回归模型和弹性网络回归模型。
(2)实现非典型的机器学习线性回归模型,包括:支持向量回归模型,回归决策树模型和K最近邻回归模型。
(3)构造基于集成学习思想的简单平均集成模型与堆叠层级集成模型。
(4)实现径向基函数(RBF)神经网络模型的构建。
(5)开发基于Django框架的伊犁马体重估测系统,完成游客、普通用户、普通管理员和系统管理员四类角色的首页展示功能、新闻公告展示、体重估测功能、体重模型训练、人员管理、账户管理和后台管理等功能。
研究结果表明:在伊犁马体重估测模型中自变量之间存在共线性问题,影响最小二乘回归模型估测精度,岭回归模型在一定程度上能够解决自变量共线性问题,提高模型线性拟合优度。在自变量较少的情况下,套索回归模型与弹性网络回归模型不具备较好的消除共线性能力。采用线性核函数的支持向量回归模型在小样本与共线性情况下拟合效果欠佳。复杂结构的堆叠层级集成模型线性拟合效果不及简单平均集成模型。在包括通用性马匹体重估测模型内的各训练模型中,径向基函数(RBF)神经网络模型具备最优线性拟合优度,说明该模型在小样本情况下能够有效去除模型共线性问题。
本研究数据主要来源于新疆伊犁地区昭苏县,该地区是伊犁马的中心产区之一。本文研究对象为两岁左右的伊犁马,主要采集马匹年龄、性别、胸围、体长、体高、管围和体重信息,通过对采集数据分析与筛选,确定了与体重信息相关性密切的胸围、体长和体高作为模型特征参数。根据机器学习模型选择路线,先选定并实现多个典型线性回归模型,为了更好地提高模型估测效果,尝试选择并实现多个非典型线性回归模型,进而为之后两个集成模型的构建奠定了基础,最后尝试建立神经网络模型以求更加优秀的估测效果。系统开发遵循软件工程规范,完成了系统前期的分析与设计,系统中期的开发与调试,系统后期的实现及测试。
研究主要成果可分为以下五个部分:
(1)在伊犁马体重估测模型中,实现典型的机器学习线性回归模型,包括:最小二乘法线性回归模型,岭回归模型,套索回归模型和弹性网络回归模型。
(2)实现非典型的机器学习线性回归模型,包括:支持向量回归模型,回归决策树模型和K最近邻回归模型。
(3)构造基于集成学习思想的简单平均集成模型与堆叠层级集成模型。
(4)实现径向基函数(RBF)神经网络模型的构建。
(5)开发基于Django框架的伊犁马体重估测系统,完成游客、普通用户、普通管理员和系统管理员四类角色的首页展示功能、新闻公告展示、体重估测功能、体重模型训练、人员管理、账户管理和后台管理等功能。
研究结果表明:在伊犁马体重估测模型中自变量之间存在共线性问题,影响最小二乘回归模型估测精度,岭回归模型在一定程度上能够解决自变量共线性问题,提高模型线性拟合优度。在自变量较少的情况下,套索回归模型与弹性网络回归模型不具备较好的消除共线性能力。采用线性核函数的支持向量回归模型在小样本与共线性情况下拟合效果欠佳。复杂结构的堆叠层级集成模型线性拟合效果不及简单平均集成模型。在包括通用性马匹体重估测模型内的各训练模型中,径向基函数(RBF)神经网络模型具备最优线性拟合优度,说明该模型在小样本情况下能够有效去除模型共线性问题。