K-Means聚类分析在高职高专院校招生中的应用

来源 :数学学习与研究 | 被引量 : 0次 | 上传用户:svkisahero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
   【摘要】聚类分析是一种按照中心点或分层的方式对样本数据进行归并的数学方法.本文在分析高职高专院校各专业招生计划人数、录取人数以及录取分数的基础上,结合K-Means聚类,从定量的角度对高职高专院校各专业如何科学制订招生计划进行综合分析,进而改进招生策略,制订更科学、合理的招生计划,提升高职高专院校生源质量和录取率.
  【关键词】K-Means聚类分析;招生计划数;录取分数
  【中图分类号】F222.33 F064.1 【文献标识码】A
  
  高等学校的招生工作是高校发展的生命线.因此,我们应该把招生工作当作一项系统工程来对待,认真加以研究.在招生过程中,必须坚持公开、公平、公正的原则;必须坚持原则性与灵活性的结合.近年来,由于高考生源人数的变化及招生选拔标准提高,一些师范类高职高专院校招生计划分配未能及时适应招生形势,造成热门专业过热, 从而有一些优质生源流失;从专业学科来看,近年来艺术类考生报考人数虽有激增,但生源质量并未受其影响.这样一类学科若继续增加招生计划,显然不合理.因此,改进招生策略,制订更科学、合理的招生计划,这就显得十分重要.
  下面,笔者以山西省某師范类高职高专院校2019年的招生情况作为主要研究对象.
  一、现状分析
  
  2019年某校高考招生总计划数为1450人,实录取1257人,计划完成率为87%.从图1、图2中可以看出:小学教育专业和语文教育专业实录取人数最多,分别为288人和286人,超出录取计划149人,占山西总录取人数的46%,计划完成率分别为180%和110%;数学教育专业和英语教育专业录取人数较去年有所下滑,平均计划完成率仅为56.6%;艺术类专业招生计划过多,录取率明显下降;现代教育技术、文秘、旅游英语、国际标准舞四个专业实录取人数最少,占山西总录取人数的1.2%.这说明,2019年某校的招生计划分配并不是很合理,致使在录取过程中出现热门专业过热、冷门专业过冷的两极分化现象.
  从图3中可以看出,2019年某校山西文史类最低分数线为257分,较2018年的159分,提高了61.6%;理工类最低分数线为130分,较2018年的152分,下降了14.5%;艺术类专业分数线较去年变动不是很大.整体来看,在总录取1257人中,400分以上有24人,[300~400]分有547人,[250~300]分有467人, [200~250]分有160人,[150~200]分有51人,150分以下有8人.整个分数主要集中在[250~400]这段,共计1014人,占总录取人数的80.7%.这说明某校2019年高考各专业录取分数整体情况较2018年虽有所提高,但增幅不是很明显.
  
  二、数据分析
  本次聚类分析的样本数据选取山西省某师范类高职高专院校2019年各专业招生计划数、录取人数、文化分数线、专业分数线4个指标为主要研究对象.本次聚类分析对数据相关性、缺失值、异常值要求比较高,同时,数据单位和不同的量级在分析时是无法进行比较的.所以,在聚类分析之前,我们先要对原始数据进行标准化处理,并对处理后的数据进行系数相关性检验、异常值检验.
  (一)系数相关性检验
  对标准化后的数据进行相关性检验,从表1可以看出,数据间相关系数最高为0.82036,这个值并不是很大,因此,其在进行数据分析时可不做处理.
  
  (二)异常值检验及箱线图
  从表2的数据异常值和图4的箱线图检验结果中可以看出,数据中异常值的个数并不是很多,其可能是由于各指标所代表的含义不同造成的(即计划数与录取数代表人数,文化线和专业线代表录取分数),因此,其在进行数据分析时可不做处理.
  
  (三)聚类分析
  本次聚类分析采取K-Means均值聚类的方法对样本的最终分类结果进行综合评估.从表3中可以看出,样本数据的最佳聚类结果为5类,平均轮廓系数为0.672998554.结合图5的分析可以发现,当簇的个数分别为2、3、4、5时,轮廓系数的数值不断升高,特别是当簇的个数为5时,轮廓系数的数值最高,为0.672998554;而后,轮廓系数的数值随着簇个数的增加越来越低.从图6中簇数量与簇内误方差相关分析也可以看出,随着簇数量不断增加,簇内误方差的数值越来越小,特别是当簇数量在[2~5]这个区间时,簇内误方差大幅下降;而在[5~10]这个区间内,簇内误方差虽有下降,但降幅不是很明显.因此,将样本数据的最佳聚类结果定为5类是合理的.
  (四)结果分析
  从表4的数据透视表分析结果中可以看出,整个样本数据的聚类结果分为5类.
  
  0类专业的文化分数线最高,但专业计划数与录取人数最不理想.这类专业主要包括文秘、空中乘务、物联网工程技术、高铁乘务等.对于以师范教育为主的高职高专院校来说, 这些专业都属于非师范专业,其优势远不如师范类专业,因此,在今后的招生中,高职高专院校应适度降低这些专业的计划招生数,以保证录取率.
  1类和4类专业虽然专业分数线比较高,但招生计划人数和录取人数并不突出.这类专业主要指一些艺术类专业,包括美术教育、舞蹈教育、音乐教育、体育教育等.虽然,近年来,艺术类考生在高考中报考人数有所增加,但高校对艺术专业线和文化线的要求标准并没有降低.因此,在今后的招生中,高职高专院校应依据当年的形势,适度控制各专业的招生计划人数,必要时可在不同的艺术类专业中做适度调整.
  2类专业虽然招生计划人数比较多,但录取人数并不理想,文化分数线居中.这类专业主要指数学教育和英语教育.对一些专科生而言,在高考时,其文化课成绩不理想,因此在专业选择上,他们更倾向于那些轻松易懂的专业.所以,在今后的招生中,高职高专院校应依据当年的高考形势,适当调整或降低这两个专业的招生计划人数.
  3类专业在招生计划人数和录取人数方面都特别占优势,这类专业主要指小学教育和语文教育.这两个专业均属于师范类特色专业,近年来受国家教育政策和就业形势影响,当下的小学教育要求必须是全科教学,凭借专业优势和就业优势,这两个专业的报考人数近年来不断增加,因此,在今后的招生中,高职高专院校应适当增加这两个专业的招生计划人数,以吸引更多优秀考生报考,进而提高招生录取率和就业率.
  
  【参考文献】
  [1]崔红芳. 模糊聚类分析在高校招生中的应用[J].数学学习与研究,2019(14):115-116.
  [2]罗璐. 湖南省硕士研究生生源质量研究[D]. 长沙:湖南师范大学,2018.
其他文献
在模糊优选BP神经网络模型的基础上,引人遗传算法,提出融入遗传算法的模糊优选神经网络预测模型,是对模糊优选BP神经网络模型的进一步发展。其基本思路是:在BP算法训练网络出现收
钻孔灌注桩在全国范围内的工程项目中得到广泛使用,工艺日趋完善。钻孔灌注桩是桥梁施工中的一项关键性隐蔽工程。施工过程中应根据实际情况选择合适的钻机和施工工艺,编写详
本文在分析以往研究成果的基础上,提出了用单权函数数值积分逼近算法(即采用一个权函数,结合数值积分法),可以同时计算出样本的变差系数和偏态系数。给出了两种单权函数的详细求解
提防工程存在着堤顶高程偏底,堤身断面单薄,土质差,堤身堤基渗漏严重等问题,加以防汛备料不足,致使洪水期间不少堤段产生管涌等渗透破坏。
目的探讨加味归脾汤联合FOLFOX4方案治疗气血亏虚型大肠癌晚期患者的疗效。方法选择中医证型属于气血亏虚型的94例大肠癌晚期患者,按照随机数字表法分为观察组和对照组,各47
为弥补燃气机组中整体模型研究的不足,提出一种将热力学模型和灰箱模型相结合的建模方法。首先,根据分块建模思想,在APROS平台上建立了热力学模型,将仿真结果与性能验收结果进行
本文介绍了功率因数的概念,并推导了功率因数的相关计算公式。通过对计算公式的分析,得出了功率因数与用电量之间的关系,明确了提高功率因数对于用电企业降低其自身电费支出
壳聚糖是一种高分子聚阳离子化合物,也是目前为止发现的唯一碱性的天然多糖,每年的生产总量仅低于纤维素,位居第二。壳聚糖因其特殊的生物学特性和理化性质而具有降血糖、调
为了分析不同沉积状态的淤泥流变特性,本文将淤泥作为线性粘弹性体,提出了根据泥水系统控制方程解答和波浪在泥床上传播时的实测变化规律求取淤泥流变参数的反分析方法,并利
详细介绍了中海海南发电有限公司洋浦电厂220 MW燃气-蒸汽联合循环机组的启动过程,对联合循环机组启动过程中遇到的疑难问题进行了分析和探讨,从运行角度提出了可行的解决方