【摘 要】
:
随着中国社会的蓬勃发展,人们越来越注重对子女的教育。高考作为国家筛选人才的全国性考试,越来越得到社会的广泛关注。科学的高考预测对高考志愿填报具有重要意义。本文收集了2016年到2020年五年间的湖北省高考高校分数线数据,并且进行数据清洗,对数值型特征进行标准化处理,对字符型特征进行编码,然后选取2016年到2019年作为训练集,选取2020年的数据作为测试集,然后在训练集中选取30%作为验证集。本
论文部分内容阅读
随着中国社会的蓬勃发展,人们越来越注重对子女的教育。高考作为国家筛选人才的全国性考试,越来越得到社会的广泛关注。科学的高考预测对高考志愿填报具有重要意义。本文收集了2016年到2020年五年间的湖北省高考高校分数线数据,并且进行数据清洗,对数值型特征进行标准化处理,对字符型特征进行编码,然后选取2016年到2019年作为训练集,选取2020年的数据作为测试集,然后在训练集中选取30%作为验证集。本文首先采用的是信息融合最小二乘法进行预测,该方法利用了数据集中的分数特征和排名特征可以相互转换的原理,分别运用两种特征进行线性预测,然后将结果进行对照、修正,以达到减小误差的目的。与直接回归预测算法相比,该算法准确度提升了3%。其次,本文提出一种基于正交子空间直和分解算法的预测模型。普通最小二乘法(OLS)利用向量在子空间上的正交投影来逼近向量,生成回归系数,然后在更高维的子空间上保持线性关系来计算预测向量。一般来说,预测向量不再是近似的向量的正交投影。基于正交子空间的直和分解原理,构造投影子空间的正交补子空间,计算补子空间中的误差向量,重构原始向量,还分析了改进方法的稳定性。实验结果表明,改进后的方法比OLS具有更高的预测精度,准确率提升了5%。最后,考虑到高考数据中的非线性特征,本文采用深度学习理论中的LSTM神经网络,并引入注意力机制对其优化改进,构建了LSTM-ATTE神经网络模型,其中包括网络层的设计、网络层参数设计、迭代次数、激活函数、优化函数等,最后对模型进行了验证实验。实验结果表明,神经网络模型准确率可以达到93%。本文尝试将深度学习理论应用于高考分数线预测,实验表明本次尝试是有研究价值的。但是还存在许多不足之处,比如,数据集需不断完善并进行特征强调,使得模型运算效率得到提高,可采用多种神经网络模型集合,来提高模型的准确率,并有机会发现新的规律。
其他文献
<正>元宇宙成为科技领域最火爆的概念之一,已悄悄地影响着短视频领域和我们的生活,对短视频行业创作也带来了一定影响,抖音上元宇宙虚偶像“柳夜熙”一夜涨粉数百万,互联网大厂纷纷投资布局元宇宙的相关技术,无数学者开始从各种角度深究元宇宙的相关概念,“元宇宙”似乎成了流量密码,吸引着无数人。本文致力于研究“元宇宙”概念对短视频行业的影响,分析市场和观众对元宇宙概念的狂热情绪,探究短视频行业如何在元宇宙概念
富有创新活力与能力的科技型企业一直是助力经济平稳增长的动力源泉,同时我国各地区战略性新兴产业的快速发展和产业结构的加速优化也离不开民营科技企业的帮助。近年来我国不同区域经济发展水平在不断提升,区域民营科技企业的融资规模也在不断扩大,但是区域经济发展不平衡和融资难仍然是困扰科技型企业成长壮大的主要因素,且不同经济区域的城市间的科技企业融资水平还呈现着较大差异,其在某种程度上融资能力的差异也是城市经济
我国钢铁行业的产业升级之路一直在学习国外的一些先进经验。但由于我国的钢铁企业往往只注重于学习国外先进企业理论和简单模式的照搬照抄,而对内控制度核心技术研究不足。只学其表而不学其内涵,使得国内外钢铁行业内部控制差距还是较大,由于缺乏先进理论指导使得国内产业和技术的升级变得困难重重。因此建立并且不断完善自己的内部控制体系成为了国内企业管理的基础出发点和落脚点,企业也要将所有的管理实践整合在自己的内部控
如何有效地表示文本语义特征以及挖掘文本潜在的情感极性一直是文本情感分析领域的重点研究内容。传统情感词典的方法往往需要人工构造大量情感词汇,分类精度取决于情感词典的完备程度。但成熟的情感词典数量很少,构建一部情感词典既费时又费力。足量有标签的训练数据是使用机器学习进行情感分析的基础,训练数据不足或严重偏置会导致分类器失效。使用深度学习进行情感分析可以通过多层神经网络自动捕获数据特征,提高了文本分析正
当今经济大环境下,我国企业的全球化经营活动越来越多,企业实现产业多元化、产业全球化、技术高端化的需求也更加高涨,中国企业逐渐踏上“走出去”的征程,由此也产生了海外并购浪潮。我国海外并购在早期主要以自然资源类企业为主,近几年逐渐转向高端制造业、消费品、医疗、科技等行业。其中医健行业最大的特点就是,产品研发费用高昂且研发难度高、风险大,所以许多企业会通过收购来获取技术资源,减少产品上市风险,特别是海外
近年来,随着互联网和跨境电商直播的发展,一批英语口语流利的复合型人才走进人们的视野。文章探讨了跨境电商英文主播直播时用到的技巧,结合大学英语口语教学实际,建构了新的教学理念,改进了教学模式。文章旨在提升大学生的英语口语水平,培养他们的英语口语实际应用能力,以期培养更多适应高质量发展、业务能力水平高超的新时代人才。
交际翻译理论指导下,要求老师开展大学英语口语教学,要注意引导学生对中西文化差异进行了解,并组织开展各种口语翻译锻炼活动,让学生在参与训练过程中,不断丰富自身英语知识结构和提高口语表达能力。本文联系交际翻译理论的基本概述,对大学英语口语教学现存问题进行仔细分析,并从丰富学生英语词汇量、有效渗透中西方文化、掌握不同翻译方法、强化口语表达实践等方面入手,提出几点行之有效的大学英语口语教学策略,以供参考。
等离子体作为物质的第四态,近年来得到了广泛的研究和发展。其中,脉冲激光诱导等离子体已被证明可以有效地将激光能量耦合到等离子体中,从而使这种等离子体具有广泛的应用价值。由于实验测试条件的限制,目前对脉冲激光诱导等离子体的研究大多集中在等离子体演化的中后期,对其早期等离子体参数的研究较少。本文通过流体力学模型FLASH模拟得到了脉冲激光诱导等离子体早期的等离子体参数演化图像,讨论了激光参数、环境气体参
量子光源包括单光子源和纠缠光源,它是量子信息处理应用中信息的载体,也是量子信息研究中重要的基础资源。按照工作波长分类,量子光源可分为可见光波段、近红外波段、中红外波段及其它波段的量子光源。目前常用的量子光源处于近红外波段,如810nm和1550nm波段,而中红外波段(约2-20μm)的量子光源研究处于起步阶段。虽然前人已取得一些进展,但近红外和中红外波段仍然缺乏高质量的量子光源。如何在近红外和中红