提高小学数学应用题分词及词性标注准确率的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:daihaolr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网科技的发展,人工智能在教育领域得到了广泛的关注与应用。通过机器解答数学应用题从而帮助学生提高解决问题的能力也是当前研究的热点,从更大范围上讲,教育机器人的开发与应用,极大地培养和提高了学生的科学素养,在教学领域也取得了丰硕的成果,因此受到了越来越多的重视。机器解答数学题的首要步骤是题目理解,其中中文分词和词性标注技术在题目理解中起着基础性的关键作用。然而,当前在很多领域良好应用的中文分词和词性标注技术在处理数学应用题时却出现了诸多问题。本文着力于研究提高小学应用题分词及词性标注准确率的问题,以期为机器解答数学应用题打好坚实基础。笔者沿用学界最新的解题框架,即创立一组语义模型,基于语义模型里的匹配模板提取题目中数量关系形成方程组从而实现题目理解。在此技术下,本论文基于小学数学应用题机器解答过程中创立的匹配模板,通过分类统计、标注并修改数学应用题目中的词性标注问题,进一步提高机器解答小学数学应用题中分词及词性标注的准确率。本文的研究内容主要概括为:第一,使用NLPIR汉语自动分词系统对人教版小学数学应用题目进行分词及词性标注,通过分析题目中词性标注的问题,总结了词性标注中的不符合匹配模板的词性,并归纳了分数、中文单位等9类词性标注问题。第二,研究设计出改进词性标注问题的方法,实现了词性标注问题的自动改正功能,将分词及词性标注的准确率达到了 90%以上,有效的提高了小学数学应用题分词及词性标注的准确性。最后,以苏教版小学数学课本及知识出版社的优等生三到六年级数学教辅作为测试集,通过实验统计分析,验证了方法的有效性和适用性,为后续更好地创建语义模型提供了技术基础。
其他文献
近年来,嵌入式以太网技术的不断发展使得嵌入式系统的应用领域日益广泛,同时也对嵌入式以太网的性能提出了更高的要求。尤其是在涉及到图像、视频、音频等大数据量传输的应用中
Android系统由于免费、开源、可移植等优点,在移动市场发展迅猛,成为占有率最高的操作系统。Android流行的同时,伴随着层出不穷的恶意软件。恶意软件可以窃听通话、窃取信息
目前,全球范围内的垃圾邮件问题日益严重,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰,给传统反垃圾邮件过滤技术带来了巨大挑战。云计算的出现和发展,打
图像分割是图像处理与计算机视觉领域中的基本技术之一,图像分割是指利用图像的灰度、颜色、纹理、形状等将一幅图像分割成若干个独立的有共同像素属性的对象,其实质是一个按
随着科技的发展和人们生活水平的提高,旅行已经成为越来越多的人生活中至关重要的一环,虽然现在有关旅行的应用系统很多,但真正能够满足用户实际需求的却很少,例如通过搜索引
虚拟心脏利用数学模型对心脏功能进行系统的仿真,以揭示其内部的运行机制以及临床医学和实验中一些无法解释的生理现象本质。该研究是一个集心脏解剖学、生理学、分子生物学
随着计算机的快速发展,软件产品在人们的生活中扮演越来越重要的角色,软件质量的重要性不言而喻,软件测试作为确保软件产品质量的重要方法,在软件的开发流程中所占的比重逐渐
随着大幅面扫描仪在更多专业领域的应用,用户在扫描精度和扫描速度上对其的需求也越来越多,进而使得新一代大幅面扫描仪的研究和开发更具现实意义。本文所述的大幅面扫描仪采用
随着互联网技术的不断发展与普及,IPv4地址不足的缺陷日益明显,作为以解决地址问题为首要目标的IPv6技术,逐渐登上互联网的大舞台。邻居发现协议是IPv6协议族中一个较为重要
近年来,随着容错技术的发展,软件容错技术作为一种提高软件可靠性的重要方法越来越引起关注。软件容错的主要技术包括:基于重复指令的错误检测技术(EDDI),基于数字签名的控制流检测