青少年在线机器学习平台文本分类子系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:kylinbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术日新月异的发展,以及人们对科技改变生活的急迫需求,使得人工智能强势崛起。针对青少年的STEM教育热点也已经从基础的编程教育,转移到了更有时代感的AI教育。如何让青少年高效且轻松的学习AI编程是现代AI教育亟需解决的问题。现有的机器学习教育平台MLFK使得任何年龄的孩子都可以直观地训练自己的机器模型,并允许在自己的Scratch程序中进行使用。但是其训练过程过于透明,用户无法真正体会和学习到机器学习训练的整个过程。针对以上问题,本课题设计了针对青少年的在线机器学习平台,并对文本分类子系统进行了研究。论文首先回顾了 AI的发展历程,并对其在机器学习教育平台上的应用进行了回顾,同时对国内外的发展情况做了总结。然后,针对青少年在线机器学习平台文本分类子系统设计了算法交互学习功能和针对中文文本分类的最佳算法自动预测功能。特别是针对最佳算法自动预测功能,提出了基于数据集文本特征的算法自适应模型。针对该模型,首先设计了中文文本数据集的特征和特征提取方法,并应用KNN算法进行训练得到可以自动预测最佳算法的自适应模型;针对自适应模型又提出了基于加权簇的KNN算法增量训练模式,实现了自适应模型的增量训练。针对用户数据集不足的情况,提出了基于标签相似度的数据增强模式,实现了对用户原始数据集的增强,进一步提高用户所训练模型的效果。基于上述设计和理论研究成果,本文对青少年在线机器学习平台文本分类子系统的各个模块进行了设计、实现和功能、性能的测试,并与传统的算法进行了对比。实验结果表明,本文所提出的基于加权簇的KNN算法和基于标签相似度的数据增强模式有效地提高了用户模型训练的效率和效果。本文就最佳算法选取在多个方面提出了新的实现思路,提高了机器学习模型效果并解决了最佳算法选取效率低下的问题。
其他文献
新疆阿克苏红富士苹果(Malus pumila‘Hongfushi’)具有果面光滑、果肉细腻、果香浓郁、果核透明的特点,富含丰富的维生素、纤维素等营养成分,素有“冰糖心”的美誉,其主产区
自1999年退耕还林政策实施以来,陕西省的生态状况逐年改善,沙尘暴天数减少,森林覆盖率提高,同时政府也投入了大量的人力物力财力对退耕还林成果进行维护。农户参与意愿是决定退耕还林政策绩效的关键因素。而随着城镇化和工业化的进程不断加快,农户对土地的依赖程度和对土地的要素投入度也出现了较大的差异,农户间逐渐发生分化,导致他们对退耕还林政策的参与规模意愿和管护意愿也出现差异。基于此背景,本文展开小农结构性
近年来,我国政府社会管理方式的改革给社区带来更多的自主权力,我国社区在高速发展中,出现了许多新型社区如企业集宿区,各种社区组织如雨后春笋一般地发展起来,在社区中发挥
无线传感器网络(wireless sensor networks,WSN)作为一种新兴技术,被广泛应用于军事监控、灾害预测、信息家电设备和建筑管理系统等社会领域中。由于无线传感器节点通常被部署于人类不便进入或无法踏足的区域中,因此如何降低节点能耗、延长电池更换周期是当前无线传感器网络研究的重点内容。分簇路由协议是提高能量利用率的一种有效手段,因此本文在无线传感器网络的相关理论基础上,对现有的路由协
水声通信技术在海洋观测、深海探测开发以及军用等方面都有着其重要的意义。由于水声信道是一个时间/频率双选择性衰落信道,码间干扰极大,对高速水声通信发展形成阻碍。现今
准确的生存期预测可以有效地将乳腺癌患者区分到不同的危险程度组,一方面可以让患者获知该预后信息以便做出更好地生活安排,另一方面可以让医疗工作者对患者制定合理的治疗计划和医疗决策,使患者能够得到更为精准的治疗。目前,多组学数据由于新一代测序技术的发展数据量呈现出逐步增长的势态,在乳腺癌生存期预测研究中,整合多组学数据的信息以进而更好地预测乳腺癌患者的生存期,是现今仍待解决的重要问题。本文结合机器学习算
随着3D建模技术的飞速发展,越来越多的3D模型应用于各个领域如工业产品设计,虚拟现实等,在这些领域中3D模型检索变的越来越重要。研究者提出了很多3D模型检索算法,其中基于多视角的3D模型检索算法取得了优越性能,但是对于多视角潜在关联的挖掘还有待提高。同时,随着深度学习的发展,也有研究者将其应用到3D模型检索中,但是目前缺乏对深度学习在3D模型检索中性能的综合评价。基于上述问题,本文首先对深度学习算
聚酰胺反渗透复合膜具有高效率、低能耗及高选择性等性能优势,已被广泛应用于水处理领域。在实际运行过程中,为了抑制水中微生物对膜造成的影响,常通过添加活性氯的方式抑制其生长和繁殖,但长期接触残余的活性氯会使聚酰胺分离层氧化降解,导致反渗透膜性能下降,使用寿命缩短。因此,膜氧化是目前聚酰胺反渗透膜在实际应用过程中面临的主要问题之一,开发具有耐氯性能的聚酰胺膜是保证反渗透膜持久、稳定和高效运行的重要途径。
随着深度学习技术的进步和大数据时代的来临,对话系统和推荐系统逐渐深入到我们的生活。常见的比如语音助手“Siri”,电影推荐网站“豆瓣”等。对话推荐系统逐渐成为一种新颖的推荐手段,系统能够在和用户进行对话时完成推荐任务。传统的对话推荐系统对话部分需要大量的人工制定的规则,推荐系统部分大多也采用的是基于检索的方法,通过不断获取用户需要的信息,在系统知识库中检索得到符合用户要求的物品。本文针对电影推荐任
随着水下勘探、环境监测、水下潜航器通信以及水下传感器信息回传等应用得到不断发展,人们对水下大容量通信的要求也在不断提高。无线光通信技术具有信道容量高、可操作性强、延迟低等优势,正逐渐成为人类实现海洋资源探测开发的重要手段。然而,现有无线光通信技术所能达到的信道容量仍难以满足人类需求。轨道角动量(Orbital Angular Momentum,OAM)可以作为复用技术的一个新维度,为更大容量水下无