融入表达式和标签的相似数学题推荐与系统实现

来源 :江苏大学 | 被引量 : 0次 | 上传用户:leon7779
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐系统是互联网和电子商务持续深入发展的结果,个性化推荐可以准确快速地帮助人们从资源爆炸式增长的网络中获取有用信息。然而,随着“互联网+教育”发展战略的提出,个性化推荐在教育领域还有待发展。近年来在线教育迅速发展,各种在线学习资源与日俱增,导致学生陷入“资源迷航”,如何从海量资源中获取适合的习题资源成为研究热点。习题推荐系统可以帮助学生高效地学习,具有很重要的意义。本研究以初中数学习题为研究对象,探讨相似数学习题推荐模型。数学习题特征复杂,包含文本与数学表达式,且拥有众多分类标签,目前习题推荐算法大多通过挖掘相似用户向目标用户推荐习题,鲜少考虑习题本身的特征。针对这一问题,本文提出融合数学表达式和标签的相似数学题推荐算法,目的是向用户推荐当前习题的相似数学题,不断的强化练习。首先基于树形码计算数学表达式相似度,然后利用数学习题的标签信息进行数学习题相似度计算,最后探讨相似习题推荐模型,设计并实现相似数学习题推荐系统。本文的主要研究工作如下:(1)数学习题中常会包含大量数学表达式,是度量数学习题相似度的重要因素。针对目前习题相似度计算主要利用文本信息,忽略了数学表达式,导致现有习题相似度计算不准确,进一步导致数学习题推荐系统习题推荐准确率不高的问题,提出一种基于树形码的数学表达式相似度计算方法(MES_TC)。本研究根据数学表达式格式的特殊性,将Math ML格式的数学表达式转换成二叉树结构,利用树形码记录节点的结构信息,通过对树形码相同的节点进行深度匹配并给出相应的深度惩罚来计算表达式相似度,从而将数学表达式信息融合到习题的相似度计算之中。实验结果表明,本方法相比基于文本的推荐有较大的优势,在推荐准确率、F1等多个指标上平均提高了2%~4%。(2)针对数学习题中应用类习题推荐算法计算过程中文本信息失效、数学表达式信息不足等问题,提出一种基于标签的数学习题相似度计算方法(ERe LS)。该方法的主要思想是:利用习题的辅助标签信息,采用标签类别加权计算相似度。首先,通过分析数学领域的知识特征和数据集中标签集的特点,把数学习题标签集分为了数学核心素养,考察的知识点和习题难度三个类别,然后分别通过不同的方法计算出不同类别标签信息的相似度,最后利用标签类别加权相似度计算获取相似数学题列表,通过top-N筛选出排名靠前的数学习题进行推荐。通过基于标签的数学习题相似度计算方法能有效解决文本信息失效和表达式信息不足的问题,进一步提高数学习题推荐的准确率,实验表明,该方法相比其他习题推荐模型都具有一定的优势,在推荐准确率指标上提高了6%~30%,在F1指标上提高了5%~20%。(3)在上述研究的基础上,本文提出融合数学表达式和标签的相似数学习题推荐算法(SERe MELT),并基于该算法完成了相似数学习题推荐系统的设计与开发。在该系统中,用户可以通过当前所练习的题目找出相似习题进行强化训练,不断加深对该类习题的理解和应用。
其他文献
化疗是临床肿瘤治疗的三大主要手段之一,但是大多数化疗药物具有水溶性差,毒副作用大,特异性差的特点,给临床治疗带来了极大的局限性。同时,临床研究表明单一化疗药物容易产生耐药性,缺乏对肿瘤组织的靶向性,很难发挥其应有的作用。大量的研究表明,有些化疗药物联合给药具有协同增效的作用。但是,目前临床上联合给药多只是简单的药物相加,忽略了联合给药时两种或多种药物的作用时间以及联合给药比例,使得联合给药协同增效
学位
靶向给药系统纳米载体被广泛研究,然而大多数纳米载体缺乏对肿瘤靶向性和特异性,并且容易被体内免疫系统识别为异物清除,使得肿瘤治疗效果仍然不令人满意。因此,迫切需要开发更安全和更有效的方法。由于间充质干细胞具备向恶性位点迁移并输送抗肿瘤药物的能力,且自身独有的主动选择性、肿瘤归巢性及免疫耐受性等特点使得间充质干细胞有望成为一种极具研究前景的肿瘤靶向载体。本研究以脐带间充质干细胞(UCMSCs)为载体,
学位
内质网是细胞合成蛋白质的关键细胞器,主要负责蛋白质的折叠和修饰。病毒的增殖会在内质网中聚集大量病毒蛋白,内质网环境遭受巨大压力,往往在表达过程中造成大量未折叠和错误蛋白的堆积,最终诱导内质网应激反应(ER stress)。而未折叠蛋白反应(unfolded protein response,UPR)则是细胞随之产生的一系列适应性反应,缓解内质网压力,病毒的增殖过程往往也和该过程息息相关。内质网伴侣
学位
目的:头颈部鳞状细胞癌(Head and Neck Squamous Cell Carcinoma,HNSCC)是一组发生于头颈部的恶性肿瘤,发病率世界排名第六。放疗是HNSCC患者除手术外的主要治疗方式,但是约有15%至40%的晚期患者在放疗后出现局部复发,在放疗中产生辐射抗性是导致治疗效果差的主要原因。抗辐射和肿瘤细胞的缺氧微环境之间的交互作用会影响HNSCC的发展,更清楚地了解HNSCC肿瘤
学位
氟硼二吡咯(BODIPY)因荧光量子产率高、稳定性好、半峰宽度窄、发射波长长等优点,被广泛应用于荧光探针领域,尤其是用于协助肿瘤诊断的成像领域。嘧啶作为在临床上使用了六十多年的抗肿瘤药物,在抗肿瘤活性方面有着巨大的影响力。将不同功能的基团(嘧啶,BODIPY)结合成为一个有机体,设计并合成了一系列新型双功能BODIPY-嘧啶衍生物,并研究了其光谱性质和生物活性,具体研究内容包括:(1)将具有良好生
学位
胰腺癌是一种致命的恶性肿瘤,在2018年公布的全球癌症死亡率中,胰腺癌的死亡率排名较高,已经排在了第七位,占所有癌症死亡的4.5%。胰腺影像自动准确分割是计算机辅助诊断胰腺癌的重要前提,其自动分割对于医学研究、临床诊断、病理分析、手术计划等医疗活动有着研究和应用价值。器官的自动分割是医学图像分析中的一个基本问题,更是计算机辅助诊断的关键。胰腺体积小且背景干扰过大,相对于其他腹部器官如肝、肾的分割更
学位
随着计算机网络带宽的迅速增加以及各种网络服务的广泛应用,社会生活对于网络流量需求越来越大。由于网络规模不断扩张且管理日益复杂,导致网络维护任务艰巨,因此网络流量预测问题日益重要并受到广泛关注。精准预判网络流量的变化趋势,可以帮助运营商准确预测网络的使用情况,合理分配并高效利用网络资源,以满足用户日益增长和多样化的需求。将自适应滤波理论应用于网络流量的建模和预测,可以有效解决预测模型无法实时自适应更
学位
随着近年来老龄化发展趋势不断深化,人们罹患慢性病的几率不断攀升,社会还面临医疗资源紧张和地区间医疗资源分配不均衡的问题,将给国民经济发展和社会生活水平的提高带来极大的阻碍。无线体域网(Wireless Body Area Network,WBAN)是由部署在被检测者体内、体表或体外的微型传感器所组建的独特无线传感器网络,各节点协作地感知、采集和处理WBAN(Wireless Body Area N
学位
肝癌由于高发病率和高死亡率,现已成为影响人体生命的重点病症之一。肝癌的早期检测与治疗能有效降低肝癌的死亡率,医学影像是检测肝癌的有效手段。近年来,我国肝癌患者数量急剧上升,医学影像的数量每天呈指数增长,导致影像科医生工作量大幅增加。为了减轻医生的负担,许多学者致力于利用计算机技术实现海量医学影像的精准分类。随着深度学习的兴起,深度学习结合计算机技术辅助医生诊断已成为一种趋势。因此,本文结合深度学习
学位
肝脏作为人体不可或缺的器官之一,对人体生命活动及新陈代谢起着重要的作用,人类生活环境的变化和不良生活习惯增加了肝脏疾病发生的风险。手术治疗是肝脏疾病治疗的重要手断,治疗中,掌握病人肝内血管分布十分重要,血管分布的复杂性要求在手术过程中必须注意保护肝脏重要血管,避免其出现损伤。准确的肝脏血管图像有助于医生分析掌握病人肝血管走向,制定出有效的手术规划,保证有效治疗。在人工智能技术发展如火如荼的今天,利
学位