基于句模的初等数学问题题意理解方法研究及应用

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:mmghb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于人工智能技术的问题求解、自动证明、类人答题等应用已经成为研究的热点,并不断取得新的突破。自然语言处理是人工智能研究的一个重要内容,其研究方法主要包括基于规则的方法和基于统计的方法,尤其是基于大规模语料库的机器学习算法的成熟,使得基于统计的自然语言处理方法成为主流。但是随着求解问题变得复杂,单一的自然语言处理方法很难取得很高的效率。本文利用上世纪90年代提出的句模理论,并结合机器学习方法对文本形式的初等数学问题进行自然语言处理,实现数学问题的题意理解。本文主要进行了以下几个方面的研究:首先,在句模理论的指导下,结合汉语形式的初等数学问题的表述特点,对数学问题中的动词进行了分类讨论,并在此基础上,研究了由动核结构形成的常见句模,包括简单句模和复杂句模。数学问题的句模研究为本文的数学问题语义处理提供了基础。其次,根据数学问题概念知识的层次性和复杂性,本文采用面向对象的方法表示数学问题的知识,并提出一种具有层次结构的面向对象知识表示框架。面向对象方法具有抽象、封装和继承等基本特征,利用这些特征,能够很好地处理数学概念以及概念间关系的表示问题。本文还对传统的知识对象模型进行了改进,将其中的规则属性分离出来,简化了知识对象的结构。然后,研究数学问题题意理解的方法,其中最核心的是基于句模的句子语义处理算法。该算法对所属句模不同但意义等价的句子进行语义归一化处理,提取句子中所含的知识。在此之前,分析了句模的表示问题,主要包含句模特征、语义成分数据和归一化函数等。为了提高句模匹配的效率,本文还研究了基于条件随机场的数学实体识别方法,用于提取句子的标注特征。通过实验验证,该方法的识别准确率和F1值分别达到了97.13%和94.98%。最后,根据本文提出的方法,构建了一个题意理解系统,用于初等数学问题的题意分析。通过测试分析了系统性能和题意理解的效果,其结果表明本文实现的题意理解系统基本能够实现数学问题的题意分析。
其他文献
随着网络技术的飞速发展,对等网络的应用越来越广泛,系统规模越来越大,网络中的资源公平共享问题也日趋严重。P2P是近年来互联网最热门的技术之一,它提供了一种开放的、自由
近年来,随着半导体工艺技术的发展,处理器芯片的集成度也越来越高,单个芯片的处理速度已近乎极限。多核技术成为现在提高处理器速度的一个研究热点,将多个芯片如何协同的工作
伴随着计算机网络的发展,计算机的安全也面临着新的挑战,传统的信息安全方法已不能有效的解决这些问题。人们把生物免疫机理应用到计算机系统和计算机网络安全中,提出了计算
DNA计算的概念由Adleman博士于1994年首先提出,同:时第一次成功使用DNA计算方法解决了7个节点的汉密尔顿路径问题。此后,多种DNA计算模型被提出并用来解决不同的NP完全问题,DN
随着我国社会信息化工作的全面开展,企业、政府单位陆续开发了大量的信息管理系统,但这些信息系统是在不同时期、根据当时不同需求而单独设计、开发出来的,各自面对单独的业
随着信息技术的突飞猛进,产生了大量的视频文档。视频压缩、视频编解码、计算机海量存储和信息高速传输等技术的发展解决了日益膨胀的视频信息传输和存储问题,如何对海量的视
B2C电子商务企业的销售预测直接影响到企业的采购和备库,从而对提高企业客户服务水平、提高企业的市场竞争力发挥举足轻重的作用。B2C电子商务企业和传统零售企业相比,其商品具
随着互联网技术的迅速发展,可扩展标记语言XML得到了极大的进步,已经成为Web上信息交换与数据处理的标准。由于XML数据具有描述能力强、结构信息丰富、语义明确、可扩展性好
作为一种当今流行的网络结构,P2P技术有别于传统的“客户端/服务器”模式。P2P网络当中的每一个节点都具有平等的地位,每个节点在享用其他节点提供的服务的同时也在充当服务
随着军队机械化和信息化建设的不断深入,多种新式车辆列入部队装备序列,对部队正规化现代化专业化的管理提出了更高的要求,需要运用高科技手段进行有效监管。军车牌照是军车