基于大数据挖掘的警校大学生公务员成功考取预测模型研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:boboluping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:警察院校大部分毕业生以考取公务员为主,为提高警校大学生公务员成功考取率,本小组进行问卷调查,使用spssstatistics和excel清洗、转换、整合数据,建立警校大学生成功考取公务员数据集。将现有的经典的具有普适作用的关联规则挖掘算法(如Apnon算法、FP-Growth算法)应用于警校大学生成功考取公务员数据集,设计适合这一主题的数据关联分析算法和数据挖掘算法,使用训练集用来估计模型运用spssmodeler、IBMWatson analytics构建多个模型,使用交叉验证选择最优模型,在R、python语言环境下对警校学生日常行为在网上进行爬虫、使用测试集来检验最终选择最优的模型的性能,不断验证模型性能,形成生态链条。最终出具调查报告,进而根据调查报告做出针对警校大学生公务员成功考取预测。
  关键词:警校生;数据挖掘;预测模型;公务员考试
  中央司法警官学院作为司法部直属司法部直属的唯一一所普通高等院校的警校毕业生,在全国公安院校拥有多种就业政策对比下,中警院的毕业生没有太多便利条件,我校大部分的毕业生在公务员考试时需要放弃自身专业的优势与社会招考的考生一起竞争为数不多的岗位,面临着失去专业优势,自谋出路巨大就业压力
  为提高警校大学生公务员成功考取率,本小组使用大数据挖掘技术,建立预测模型。根据预测结果,为毕业生报考公务员提供决策支持为新人学的新生在大学四年所在的不同阶段的学习提供规划指,为将来的工作做好职业规划,并为我校的教学部门和管理部门探寻针对警校大学生更加有效的管理模式和教学方式提供帮助。我们对调查问卷的数据进行处理分析后得到的初步调查结果。
  1我校考生的大学个人履历调查
  1.1學生参与活动调查
  我们通过调查问卷调查学生参与活动情况,来调查参与活动是否对考公务员有所帮助,调查结果见图1所示。在图1中,有31.1%的毕业生,认为专业知识竞赛对考上公务员最有帮助。作为警校学生,在大学所学的专业知识基本于实际工作中的业务接轨,有很强的联系性。参与专业知识竞赛能巩固自己的专业知识,提高自己的专业水平,而其中脱颖而出的优胜者更受到用人单位的青睐。占到21.3%的科研创新项目竞赛也同样如此,这样的活动一是培养了学生的学习能力、科研创新能力,二也证明了学生出类拔萃的综合素质,为用人单位在面试时提供参考。辩论大赛之所以能有19.5%这么高的比例,那是应为公务员考试需要进行面试,在笔试中也有诸多考察逻辑能力的考题,所以这也是学生认为一个值得参与的重要活动。
  因此我们在这建议学生在大学期间应该多去参加以上这3种活动,来提高自己的能力,为将来的公务员考试作准备。当然别的小比例的如运动会、创新创业大赛、歌舞大赛活动也可以多多参与,结交朋友陶冶情操,毕竟读大学的目的不单单是为了考公务员。
  1.2学生心中最重要的个人资质和证书调查
  在大学的四年中学生会考取许多证书和取得各种资质,我们想找出哪些证书资质是对公务员考试是有用的哪些是无关紧要的,所以我们对学生心中最重要的个人资质和证书进行调查,调查结果见图2所示。
  在图2中,学生心中最重要的个人资质和證书是大学英语四、六级占其中的48.3%,其次是司法考试占30.2%,党员占30.2%,计算机二级占22.1%,驾照占14.9%,心理咨询师占12.2%。由此我们可以直观地了解到在大学期间最重要的3个证书资质分别是大学英语四、六级证书、司法考试证书和党员。在我们看来公务员考试很大程度上是以学历为基础,以能力和证照为标准的人才选拔机制。学院考公成功的同学们,认为党员、大学英语四、六级、计算机二级和司法考试等证书非常有用。资质和证书,在某种程度上代表了能力的高低和大小。在对手和自己能力不相上下时,资质和证书的含金量和数量很可能会成为你打败对手的杀手锏。因此,我们建议尽可能多的考取一些社会热门、用人单位急需的(含金量高)的资质和证书,对考公轻松胜出是很有帮助的。
  2我校考生复习迎考策略和技巧
  由于公务员考试每年热点考题、题型都会有一定的变动,所以我们为了提高学生公务员考试成绩,为了更有效率的复习迎考,我们就公务员考试复习迎考策略和技巧进行调查。
  2.1准备公务员考试的方法
  我们调查了绝大部分毕业生公务员考试准备阶段的学习方式,以比较出最有效的学习方式供同学们参考,各方法所占比例,见图3所示。
  在图3中,有36.16%的学生的学习宗旨是计划明确,瞄准真题,掐时练笔,查漏补缺,这种学习方式可以给自己带来非常高效的学习效率,并且可以在学习的同时养成良好的学习习惯,使自己在考试中不丢冤枉分。其次是占24.29%的人积极利用网络公务员考试平台信息,通过此方式可以及时获得最新的公务员考试信息和一些地方政府的政策,使自己可以全方位的去挑选适合自己的岗位,最大限度的发掘自己的潜能。参加学院开设的公务员选修课,在老师的指导下学习也占到19.2%,说明这也是一个非常有效的方法,通过老师传授自己多年的经验,可以使自己在公务员考试中少走弯路,将精力留在最正确的环节上。漫无目的的题海战术也占到6.92%,这种低效率低质量的学习方式经调查是不可取的,所以我们要去寻找最有效的学习方法。
  所以我们希望同学们可以将高效率高质量的学习方法相结合,使它们互相贯通,已达到学习效率的最高境界,这样才能使自己在公务员考试中马到成功。
  3我校警务化管理、警察特色教学的影响
  中央司法警官学院作为一个警察类院校,采用警务化管理和警察教学,有着其他地方院校所不具备的特色,所以我们就警务化特色管理、警察教学带来的对学生公考的帮助进行调查,调查结果见图4所示。
  这一调查采用不定项选择题进行测试。在图4中,所有学生中有83.67%的人认为警务化特色管理可以使自己有规范得体的行为举止和昂扬向上的警察精神风貌,帮助自己考公务员。有77.56%的学生认为警察特色教学强化了政治意识、警察意识和法制意识,此外64.29%的学生认为这样的特色大学学习对参加招考警察类公务员体能测试(警务技能)帮助很大,还有66.33%的学生因此具备了很强的时间观念和效率观念。   由此看出学院警务化管理对学生考公帮助很大,主要集中在思想建设、风貌举止和体能锻炼三个方面。这说明学院的警务化管理模式是一种科学的管理方式,能够实现教育和管理的有机结合,帮助学生养成准警察、准公务员的良好行为习惯。因此,我认为学校可以从公务员就业标准和考公要求的角度,突出专业优势,进一步探索科学发展、健全完善学院警务化管理的教育内容和管理方式。
  4警校大学生公务员成功考取预测
  4.1选择算法,构建模型
  我们科学地剔除噪音,确定对于成功考取公务员重点因素之后,进行模型的设计。不用类型数据的数据使用不同的算法进行建模。结构化的数据(学生的個人成绩,个人学习时间)使用逻辑回归构建模型。半结构化的数据(学生的日常行为记录)和非结构化数据(面试过程,复习过程)使用决策树或者支持向量机svm构建模型。
  对于结构化的数据例如考生的国考成绩与复习时间的长度之间的关系等等我们先将两种数据挑选出放入一个Excel中,使用spss modeler选择线性回归算法对数据进行建模。在图5中10小时的复习时间能达到148分的峰值,达到效率最大化。从复习10小时到复习12小时的成绩呈现下降趋势,成绩148分能滑落到136分这样一个谷值和复习5个小时的成绩持平。而从复习5小时到复习12小时成绩呈现上升趋势是一个效率提升的过程。
  对于半结构化的数据,我们筛选出适合决策树算法的出关系显著因子,分为三个方向:个人履历优势、特色教学优势、考试复习策略,在个人履历优势中存在4个因子分别是:是否担任过學生干部、突出素质特长、在校期间是否获过重大奖项、在校期间是否经常参加活动,在特色教学优势中存在2个因子分别是:警务化管理是否有帮助、所学专业是否有就业优势,在考试复习策略中存在2个因子分别是:报网课还是面授课、准备公考是自学还是报班。构建决策树模型,做出预测符合以下两种情况的学生具有大概率成功考取公务员:
  情况1:担任学生干部,自学复习公考,逻辑思维强口才出众,体育好身体素质出色,精通政治理论文笔好,服从警务化管理的学生;
  情况2:担任学生干部,报班复习公考,上面授课,逻辑思维强口才出众,体育好身体素质出色、精通政治理论文笔好的学生。
  4.2测试模型,构建生态链条
  我们会使用python语言编写代码在校园网、贴吧、微博、人人网上对警校生日常行为进行爬虫,构建一个动态数据测试集同时加入时间序列模型来检验最终选择最优的模型的性能,。
  同时由于公务员考试每年政策的改变,会有不同的热门考点,因此我们会根据每年不同情况,将测试集的反馈结果,在作为重要因子重新放人模型中,训练模型,不断优化模型性能。使模型能自我学习,形成一个构建一测试一反馈一构建的生态链条。
其他文献
摘要:伴随着网络产生,网络舆论成为一种重要的舆论形式,微博作为为大众提供娱乐休闲生活服务的信息分享和交流的平台,在微博这个平台上,人们轻而易举地获取实时信息的同时,也可以表达自己的意见观点,宣泄自己的情绪,于是人们就把微博打造成了一个新的舆论场地,而微博舆情是一种不可忽视的力量。因此,该文从社会公共事件入手,分析微博舆情对事件发展的影响和作用,在前人研究微博舆情成果的基础上,探讨微博舆情的传播周期
摘要:MOOC作为在线教育的阶段性产物成为教育界的新宠,国际知名高校纷纷搭建MOOC平台推出MOOC课程。然而MOOC既需要巨额资金的支撑又要以高校的综合实力和影响力为后盾,并不适合于地方高校。SPOC因为具有小规模和限制性特征,可以搭载更加专业内容,便于实施有效师生互动,能够结合翻转课堂进行混合教学,而且成本较低更具可持续性,日益受到国外高校的青睐,也出现了一些成功地案例,这为我国地方高校的在线
摘要:传统教学模式在高职教学中已经无法满足学生的学习需求,同时也满足不了学生对学习时间高灵活性的需求,本文针对如何解决学生自主学习的问题,以《计算机网络技术》课程为例,对基于微信的微课自主学习模式进行了研究。本文先对微信和微课的现状进行分析,然后对基于《计算机网络技术》的微课资源进行研究,最后使用传统教学模式的学生和使用基于微信的自主学习模式的学生进行对比,得出基于微信自主式学习模式优于传统模式,
摘要:课堂教学是学生获取知识的途径之一,课堂教学必然有课程安排,课程是指学校学生所应学习的学科总和及其进程与安排。什么是课程?课程是指学校为实现培养目标,学校教授学生学习各门学科进行有目的、有计划的教学活动。课程在教育过程中的地位是非常重要,课程改革是教育改革的核心内容。为了提高学生的学习能力和综合素质,让学生毕业后适应工作岗位,适应社会职业的需要,我校计算机专业进行了一系列的专业课程教学改革,本
摘要:多媒体教学设备已成为各学校日常教学必备的工具。多媒体教学在教育领域得到广泛应用,本文对多媒体教学系统的构建做了深入的分析和探讨,希望为建立新型教育教学方式提供有益的经验及分享。  关键词:多媒体教室 多媒体教学系统 平板智能电视  中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)15-0216-02  随着时代的进步和科学技术的不断发展,学校教育面临新的挑战,教
摘要:我国应用型电子信息人才有较大缺口,这与高校人才培养模式的不合理性有很大的关系,该文主要针对电子信息专业应用型人才培养模式进入深入分析与研究,并对人才培养模式提出了一些设想。  关键词:应用型人才;电子信息工程; 创新; 培养模式  中图分类号:G710 文献标识码:A 文章编号:1009-3044(2017)02-0117-02  近年来,随着电子信息产业的飞速发展,电子信息工程应用型人才需
摘要:近年来,大学生参加全国计算机(NCRE)等级考试热情和积极性逐年增高,2015-2016年,九江学院的NCRE报考人数每年平均在18000名以上。NCRE组织管理无小事。文中较为全面地阐述了如何做好NCRE考试组织管理工作,需要注意那些问题,对开展NCRE考试的同类高校具有一定的参考价值。  关键词:NCRE;考试组织管理;总结  中图分类号:G642.0 文献标识码:A 文章编号:1009
摘要:该文以电子课程设计为基础,尝试将体验式教学与中职专业课实际教学相结合,力求在层层递进的体验式教学设计中激发学生的学习动机,培养学生在已有知识水平的基础上自我提高。将体验式教学理论与中职专业课教学相结合能够有效提高中职课堂效率,并培养学生良好的学习动机。  关键词:体验式教学;中职生;电子课程设计  中图分类号:G424 文献标识码:A 文章编号:1009-3044(2017)25-0156-
摘要:形象化教学法是提高课堂教学效率的重要方法。针对当前《计算机网络》课程的课堂教学方法问题,探讨和梳理了一些在计算机网络课堂教学中可以采用的形象化教学方法,并按分层的思想提出了分层实施形象化教学的具体方法。  关键词:形象化教学法;计算机网络;协议分析;网络仿真  中图分类号:G642 文献标识码:A 文章编号:1009-3044(2017)14-0121-02  在当前高等教育教学质量内涵建设
摘要:多轴无人机航拍和手持拍摄的视频不可避免的会产生画面抖动,Mercalli软件针对视频的低频震动进行后期减震处理,以最大程度的获得理想、稳定的视频画面。  关键词:视频;后期减震;Mercalli  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)28-0227-02  Abstract: Multi-axis UAV aerial video and hand