基于机器学习的试题多知识点和认知动词自动标注研究

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:jianghulong007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网教育时代,教育信息化为教育领域带来了重大变革,很多教学资源都以数据的形式存储。其中尤为重要的是试题数据资源。而现在普遍存在的情况是,这些试题数据在设计时仅仅包含试题的内容和答案,并没有直接给出试题所考察的目标,即缺少认知动词和知识点的标注。因此,如何能自动地为试题标注所考察的知识点和要求的认知动词层级,更好地发挥试题数据资源的作用是一项十分有意义的研究内容。基于此,针对数学试题数据本文的研究任务主要分为两部分,分别是基于机器学习的知识点标注和认知动词标注。(1)提出了一种基于集成学习的多知识点标注方法。在试题知识点标注方面,首先对试题知识点标注问题进行了形式化的定义,将试题多知识点标注问题转化为多标签分类问题;借助教材目录和领域知识构建知识点的知识图谱,并以此作为试题的知识点标签体系,并用知识图谱对原始的试题知识点数据进行了替换;构建了以支持向量机为基分类器的集成学习多知识点标注方法,通过设置子集准确率阈值来筛选出优基分类器进行集成,以期达到更好的标注效果。(2)提出了一种基于数据增强的数学试题认知动词标注方法。首先,使用不同认知动词下的试题文本数据分别构建深度文本生成模型,用于生成不同类别下的大量数据,以便弥补原始数据中存在的不平衡问题。其次,在设定文本长度阈值对生成的数据进行初步筛选的基础上,借鉴主动学习的样本查询策略,使用不确定性抽样方法对生成数据进一步筛选。最后,使用筛选得到的生成数据和试题数据结合用于训练TextCNN模型。本文对数学试题知识点标注和认知动词标注进行了研究,提出了两种不同的标注方法,在一定程度上都优于传统的机器学习标注方法。
其他文献
本文通过对长管棚、单层注浆小导管、双层注浆小导管等三种超前支护技术类型的优劣、适用环境、受力、刚度等特点对比分析,确定双层小导管超前支护技术在隧道穿越软弱围岩应
间接法生产浓硝酸(简称间硝)中,浓硝镁液吸收稀硝酸中的水分,产生的稀硝镁液加压进入硝镁蒸发器,蒸发产生的二次蒸汽进入间冷器冷凝,得到的含少量硝酸的冷凝液进入镁尾水槽,称
在油气勘探开发过程中录井技术始终是一项非常重要的作业过程。石油开采过程中的录井技术主要是利用先进的录井设备对井下的各种信息进行收集、记录,并通过对信息的分析为钻
在解答日语能力测试题时,发现有「ずくめ」「だらけ」「まみれ」的选择题经常使学生感到困惑.这三个词作为无词性变化的接尾词都具有'几乎是……'的意思,译为汉语也
期刊
企业的全面预算管理一般包含预算编制、预算执行、预算监督和年终决算四个环节。企业根据自身的实际状况选用适合自己的、恰当的、科学的编制方法,这是实施全面预算的基础。
通过对宝浪油田联合站三相分离器腐蚀产物和污水水质分析 ,摸清了三相分离器的腐蚀原因。在此基础上 ,对缓蚀剂和杀菌剂进行了筛选、评价 ,完成了对加热盘管的防腐蚀技术改造
目的应用RetCamⅡ进行新生儿眼底筛查,观察新生儿眼底病变情况,探讨筛查足月儿视网膜疾病的必要性,研究新生儿视网膜出血的相关因素。方法收集2011年3月1日至2012年2月29日在
目的:应用染色体G显带技术观察4MV的X线辐射后的染色体畸变情况,分析不同类型的染色体畸变和辐射剂量的关系。方法:以4MV的X线0.5、1、2、4Gy对离体人外周血进行辐照,其淋巴细
近日听到一种说法:有的权力部门干部,喜欢把权力当动力追求、当能力炫耀、当魅力自诩、当威力使用,自我感觉良好,群众意见很大,造成了很坏的影响。这种说法给我们提出一个重要课题