基于机器学习的马匹健康预测评价体系的建立

来源 :新疆农业大学 | 被引量 : 0次 | 上传用户:jeff2047
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能等新技术的不断发展以及大数据时代下的背景,将机器学习等新技术与传统的畜牧业结合起来是一个非常现实的问题。马产业在传统的畜牧业中占有很大一部分的比重,因此使用人工智能结合统计学的手段建立马匹健康状况预测评价体系,对畜牧业的发展和马匹的精准医疗具有重要的意义。本文对马匹的诊疗数据进行量化、评价、及预测做出研究,将量化后的特征进行衍生,衍生出的三组数据可以较好的反应马匹未来健康状况,分别是GroupⅡ(入院时疾病表现),GroupⅢ(入院时的生理数据)以及总分。通过三组之间死亡组与存活组之间的评分及相关性,借助受试者工作特征曲线(ROC曲线)分析得分对马匹未来健康状况的预测效力,并将其作为马匹健康评测的重要指标。使用机器学习的方法预测马匹的健康状况是为了从数据科学的角度看待影响马匹健康状况的重要特征,结合马匹入院时18项特征应用机器学习模型来对马匹未来的健康状况做一个合理的预测,具体的工作成果可以总结为以下几点:(1)马匹数据补全。在对原始数据进行数据处理过程中将缺失值及异常值进行删掉或填补,并对简化急性生理评分中并未明确提及的疾病,通过查询资料,请教动医方面的专家等予以量化评分,从而获得完整的数据集为后续的分析及模型的构建奠定了基础。(2)特征工程。结合前人的研究,将总数据衍生出四个独立变量,每个变量根据之前量化的数据综合考量,探究死亡组和存活组的不同评分对健康状况的反应程度,以此来决定最佳截断值。(3)马匹健康预测模型的构建。在构建融合模型时先用了比较常见的机器学习分类模型,包括:K-近邻模型,逻辑回归模型,支持向量机模型,决策树模型。接着构建了集成模型,包括:随机森林模型,GBDT模型及Light GBM模型。所有的模型在原始数据集及经过特征选择及参数优化后的数据上进行预测,综合考量选取四个较优的机器学习模型构成Stacking融合模型。通过分析研究表明,GroupⅢ这一衍生变量的最佳截断值为15.5分,AUC值达到了0.842,敏感度为83.6%,特异度为74.6%,可以较好地评价马匹健康程度。以RF,GBDT,LGBM为基模型,逻辑回归为元模型构建的融合模型在原始数据、经过特征选择的数据、欠采样平衡数据集及过采样平衡数据集上表现得都优于单个模型。模型融合和特征数值量化也为其他预测评价研究提供了参考意义。
其他文献
棉花是锦葵科棉属植物,其作为天然纤维的主要来源,在我国经济作物中占有重要地位。随着全世界气候变化,干旱已成为限制世界农业发展的重要因素。尤其是在常年干旱缺水的新疆,环境的改变对棉花抗旱的能力有了更高的要求。因此,如何快速和简便的识别棉花受到了干旱胁迫以及筛选鉴定抗旱品种是目前棉花抗旱需要解决的关键问题。随着无人机遥感平台和传感器小型化轻量化的发展,利用无人机遥感平台实时获取遥感数据成为业内的研究热
学位
为探明氮肥减量条件下配施生物质炭对北疆灌区土壤有机碳含量、春小麦氮素吸收利用及其产量的影响,采用小区试验,设置对照(不施氮,CK)、常规施氮(300 kg·hm-2、N1)、单施生物质炭(20 t·hm-2、B)、常规施氮+生物质炭(N1B)、减氮15%(255 kg·hm-2、N2)、减氮15%+生物质炭(N2B)、减氮30%(210 kg·hm-2、N3)、减氮30%+生物质炭(N3B)8个处
学位
近年来,测土配方施肥在全国各地展开,为了解哈密巴里坤地区测土配方施肥落实情况及取得的效果,在哈密巴里坤地区开展肥效试验,以新春48号春小麦为研究对象,在测土配方所推荐施肥量(NPK)的基础上设置:缺素(NP、NK、PK、NPK)、磷钾配施氮肥梯度(PK、70%N、NPK、130%N),氮钾配施磷肥梯度(NK、70%P、NPK、130%P)共8个处理,通过布置大田试验分析不同施肥处理对土壤养分、小麦
学位
小麦是世界三大粮食作物之一,也是中国北方地区最重要的粮食作物。受人口增长、天气灾害、气候灾害、疫情生态灾害和水文灾害等不确定性因素的影响,我国粮食需求还将保持刚性增长的态势。应用无人机能够无损、快速准确、及时高效地估测小麦产量,可以有效加快作物高产基因型的筛选和辅助分子育种工作,同时为农业生产计划制定、粮食安全保障、国家经济和宏观决策提供科学依据。通过机器学习方法充分挖掘灌浆期冬小麦冠层无人机多传
学位
报纸
<正>日前,山西省长治市人大常委会原副主任王辅刚被开除党籍。王辅刚已于2018年6月退休,山西省纪委监委的通报指出其“退休后违规在民间社会团体中兼职取酬”。党员领导干部退(离)休后违规兼职取酬的情况不在少数。2018年7月,已提前退休6年的浙江省杭州市公安局原副巡视员邱平,主动要求放弃退休待遇。3年后,在全国政法队伍教育整顿中,邱平违纪违法问题线索浮出水面。
期刊
野果林是世界栽培落叶果树的重要起源,同时也是世界上稀有的生物多样性天然基因库。其中主要优势种新疆野苹果(Malus sieversii(Ledeb.)Roem.)既是国家二级重点保护植物,又是生物多样性优先保护物种之一。但近年来,野苹果林分布面积减少,存活数量大不断下降。因此,本研究以塔城地区额敏山区分布的野苹果林为研究对象,采用典型样地调查法,通过在不同立地建立样带、样地,从而获取野苹果林群落学
学位
新疆南疆风沙地区种植的紫花苜蓿(Medicago sativa L.)因苗期生长缓慢、受风沙影响成活率低,普遍采用小麦(Triticum aestivum)保护紫花苜蓿播种的方式。为探索一种资源利用效率高、经济效益好且适合当地推广发展的最优种植模式,本研究以新疆南疆地区紫花苜蓿主要种植模式为切入点,以小麦和紫花苜蓿为研究对象,选择当地紫花苜蓿的5种种植模式,分别为M1(冬小麦套种紫花苜蓿)、M2(
学位
本研究以连作栽培色素万寿菊为试材,探讨连作年限对色素万寿菊根际土壤性状的影响;研究不同改良处理对色素万寿菊播种出苗、幼苗生长、生长发育及根际土壤环境的影响,以期为缓解色素万寿菊连作障碍提供帮助。主要结果如下:(1)色素万寿菊不同连作年限植株根际土壤性状比较显示,随连作年限的增加,土壤p H值下降,含盐量上升,土壤有机质和速效氮磷钾含量先升后降;连作7 a后土壤脲酶、过氧化氢酶和蔗糖酶活性均有所降低
学位
<正>在美国国家科学基金会(NSF)担任临时雇员的研究人员能够在引入技术专业知识的同时加深对NSF内部工作的理解。物理专业毕业生的职业选择主要分为三种行业类型:工业界、学术界以及政府部门。毕业生在选择上述类型作为第一份工作后,即便之后更换雇主或岗位,也不太可能跨入一个新的行业。如果科研人员无意离开原先的职业路径,他们也可以选择跳出舒适区,尝试全新的经历,分享自己的知识或获得新的专业知识。担任NSF
期刊