面向数值型数据的汉语文本自动生成系统开发

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:strongstrongqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言生成(Natural Language Generation,NLG)作为人工智能和计算机语言学的一个分支,是当前国内人工智能发展的一个重要的研究方向。其根据不同的输入数据类型划分为基于数据、文本和视觉信号的文本生成,从而自动生成高质量的人类可理解文档或报告等。随着大数据时代的快速发展,环保信息化已日益成为推动生产力发展的重要力量,我国对大量的环保信息数据进行搜集和分析,而如何充分使用这些数据则是当务之急。本文将NLG技术与数值型数据进行结合,利用国家声环境功能区监测数据和三江源生态环保数据,开发一款面向数值型数据的汉语文本自动生成系统,通过本系统可以提升数值型数据到文本生成方面的理论和技术支持,促进国内关于汉语文本生成方向的继续发展。本文首先分析了NLG的研究背景和国内外研究现状,总结了数值型数据在文本生成系统建设中的不足之处,将实际用户需求和系统的建设结合起来。系统在开发过程中遵循了标准的软件开发流程,并对开发的每个阶段进行了详细的介绍。在系统需求分析基础上进行了功能模块需求分析和文本语料库分析等。在系统实现方面采用了轻量级SSM框架,并使用MySQL关系型数据库进行数据存储,在数据到文本生成技术方面进行了文档规划、微观规划、文本实现等几个步骤的详细介绍和实现。最后对不同权限的用户进行了功能模块测试,并采用基于人的评价方法进行了文本评估测试。通过本次设计,系统在功能上基本满足用户需求,在生成文本的质量上能够符合用户对文本的质量要求。本系统的实现对国内NLG系统的研究有一定的理论意义和参考价值,且具有良好的使用和扩展前景。
其他文献
近十年来,2μm光纤激光器因其在医疗、材料加工、激光通信和大气监测等领域所具有的独特优势而成为了科学研究的热点。多波长运行态和锁模运行态是2μm光纤激光器中应用广泛
俄罗斯境内国际过境运输的发展是“一带一路”倡议中俄中合作的领域之一。西伯利亚大铁路在国际过境的发展中起着主要作用,这是连接亚太地区和欧盟国家的铁路“桥梁”。西伯
氧化锌纳米线材料因其直接带隙和大的比表面积等特点,具有独特的光学性质和电学性质。近年来,氧化锌纳米线在众多领域中的应用被广泛研究,包括光电探测、气体传感、生物传感
随着人工智能的发展,各行各业都产生了各种各样的数据。这些数据呈现出海量、多元化、高维等特点。然而,在这些大数据中,很大一部分属性的作用是微乎其微的,它们增大了计算机
活塞是船用柴油机的“心脏”,它决定了柴油机的动力性、可靠性及经济性等,是柴油机最关键的部件之一。活塞通过高速往复运动传递柴油机的原动力,其加工精度的不达标通常会引起销孔开裂、侧部磨损以及外圆损伤等破坏性失效,影响柴油机的使用寿命。铸铁活塞是一种常用的船用柴油机活塞,由于其结构复杂、壁厚较薄且径向刚性较差等特点,而在生产过程中容易发生加工变形,难以保证加工质量。因此,研究船用柴油机铸铁活塞的加工工艺
写作在英语四项基本技能中处于很重要的地位,但又使许多外语学习者心生怯意。几十年来,许多研究者和教育者聚焦如何提升语言学习者的写作准确性。一些研究者(Ferris,2004;Fer
随着工业时代的逐步推进,机械设备的结构、系统、控制等之间的联系日趋紧密和复杂,无论是哪一部分发生了失效或出现了故障,都会牵一发而动全身,轻则机械设备性能无法实现预期功能、控制系统发生失效,重则产生灾难性的后果。机械设备故障的产生,除了会造成巨大的经济和财产损失外,严重的还会造成重大的人员伤亡、环境污染和恶劣的社会影响。因此,对机械设备的故障特征的研究,则是保证生产生活顺利进行的重要课题。故障诊断问
邰爽秋是我国近现代教育史上著名的教育家,民生本位教育思想的创始人和民生本位教育实验的践行者。邰爽秋因其卓越的理论贡献和躬身力行的实验创新精神,与陶行知、梁漱溟、晏
不平衡数据是指数据集中属于某一类别的样本量远超过其它类别的样本量,即所属不同类别的样本量间存在较大差异。研究人员常把在数量上处于劣势的样本称作正类样本,而把数量较
随着高通量测序技术的飞速发展,从癌症分子水平上了解致癌的发病机理已成为现实。研究发现导致癌症发生的失调信号通路或调控通路通常由多个驱动基因共同作用,即通路中任何一