试题智能提取技术的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:haozhizhegogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用技术与在线教育、在线考试相关理论和方法的发展与结合,计算机已经逐步成为教育环节中需要使用的常用辅助工具。考试成为教学环节中具有重要影响作用的组成部分,在考试过程中试卷发挥着重要的作用。以往考试多采用线下的纸质试卷进行,编写试卷主要使用Word等文本编辑软件进行,这样就现存了大量的试题文档文件。在线考试逐步发展起来,很多考试使用计算机作为考试工具。试卷如果仍然采用传统的手工录入方式就难以满足题库系统的发展速度,因此如何利用计算机技术将大量的现存的试题文档中的试题内容准确、快速的导入到题库系统中成为在线考试系统发展过程中需要面对的重要研究课题。论文主要研究了将以Word文件格式保存的试题文档中的试题文本信息进行智能抽取、识别并导入试题库系统的技术和理论。论文首先介绍了试题文档的结构,以及Java相关技术获取文档内容的方式。根据试题文档的结构特点,使用规则引擎Drools进行试题内容结构分析,将不同试题部分内容抽取出来,再抽取出来的试题信息内容形成符合QTI标准的XML文件供题库系统灵活调用。使用Drools规则引擎,可以将复杂多变的试题解析规则的业务逻辑从编码工作中分离出来,从而实现比较智能的、具有自适应试题内容变化的试题识别、提取功能,减少试题识别时人工输入的劳动量。最后在将功能应用于原有考试系统的J2EE框架中。经过系统的测试使用,达到良好的试题内容的提取和导入效果。
其他文献
本文基于琼东南盆地油气资源丰富且主要来源于渐新统煤系烃源岩的基本事实,采用地球物理学、煤地质学、岩石学、沉积学、层序地层学等基本理论,结合地震、地化、测井、古生物等基本资料,充分吸收前人最新研究成果,在琼东南盆地渐新统开展了煤系烃源岩沉积体系、层序地层、发育与分布、生烃演化等相关内容,由于煤系烃源岩主要发育在崖城组和陵三段,本文将以崖城组、陵三段为主要探讨对象去分析煤系烃源岩的发育、分布与生烃特征
我国有十四亿人口,每个人都是消费者,这意味着我国是个消费大国。随着社会主义市场经济实施以来,社会经济得到不断的发展,生产者、经营者在追求经济利益时,由于利益的驱使,侵犯消费者权益的事件不断发生。数据表明,2016-2019,全国消费者协会组织共受理消费者投诉案件近300万件,解决258万件,仍然有42万消费者投诉未得以解决。消费纠纷虽可以通过私益诉讼途径解决,但是由与信息不对称,消费者提起私益诉讼
目的肝纤维化的主要特征是细胞外基质(ECM)的过度累积,活化的肝星状细胞(HSCs)是ECM的主要来源。但是,肝纤维化所涉及的确切靶分子尚不清楚。本研究旨在通过构建四氯化碳(CCl_4)诱导的肝纤维化小鼠模型筛选出在小鼠肝纤维化组织中显著差异表达的m RNAs,从中选择转录激活因子3(ATF3)。拟进一步验证其与肝纤维化发生发展的相关性,阐明其在肝纤维化中的功能以及作用机制,为肝纤维化的治疗提供新
能源紧张和环境污染问题迫使各国努力寻找可持续发展的新能源和先进的能量储存转换技术。我国亦将新能源以及新材料等列为了国家的战略性新兴产业,然而可以明确看出的是的是,
随着科技的发展和人们日常生活水平的不断提高,人眼接受的信息来源更加丰富多样。这些信息的载体中尤以视频所含信息量最大,如何在日益复杂的视频场景中提取有用的显著性区域
随着天线数量的增加,大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统上行链路信号检测算法的复杂度也大幅增加,原有检测算法无法实际应用在工程项目中。因此,本
随着生物技术的发展,种子技术对促进世界粮食和经济作物的品质和产量都有重要意义。以种业跨国公司为中心的种子企业整合了资本、研发团队和销售渠道,在全世界配置资源并进入
农业上市公司拥有多样化的生产资源,但是由于农业企业受气候、自然资源、国家政策、农产品价格水平等多方面因素影响较大,因此农业企业的财务绩效存在较大的波动风险,企业必须找到适合自己的发展道路。多元化经营战略能够分散企业的经营风险,增加企业利润,提升财务绩效。但是多元化经营战略选择不当,会分散企业现金流,使企业财务杠杆失衡,扩大公司财务危机。企业运用多元化经营战略的效果,可以通过其财务绩效来呈现。为了深
随着互联网的飞速发展,互联网已经渗透到每个人的生活。而微博这样的社交网络平台更是风靡社会,迅速成为了人们聊天交互、信息获取的重要方式。国内外主流微博平台都积累了数
上海作为经济发达城市,是中国经济的重要支柱。近年来,上海GDP增速趋缓,并且按照经济普查口径核算的GDP总量略高于修订前数据。国内外研究显示,GDP统计范围并非全面,存在一些