一个面向中文古诗词理解难易度的人工标注数据集

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lbtx368
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
向读者推荐阅读难度合适的古诗词有助于提升读者的诗词鉴赏能力。现阶段,围绕古诗词可读性自动化分析的相关研究的突出局限之一是缺乏大规模高质量的数据集。针对该问题,该文研究面向古诗词可读性自动化分析的数据集构建。该文作者对外开放了包含1915篇古诗词的标注阅读理解难度的数据集(1)。该文首先将数据集划分成易中难三级,构建数据集APRD;然后进一步细化标注,构建六级分类数据集APRD+。抽取教材中的诗词组成标准集,以年级为标准难度级别,计算标准集与APRD、APRD+之间的Spearman相关性,Spearman
其他文献
目的探讨大剂量阿托伐他汀联合美托洛尔对急性充血性心力衰竭合并肾功能不全患者的疗效。方法选取2017年3月至2019年4月焦作市中站区人民医院收治的68例急性充血性心力衰竭合
针对话音通信过程存在的缺陷,设计数字化的基于数据链技术的报文通信系统,给出系统原理,结构组成,重点给出系统的软件设计和实现过程.
[摘要]文章采用文献资料法、逻辑分析法等方法,对当前我国高校体育教育专业办学中存在的问题进行分析,针对这些问题,提出了相应的对策和建议。   [关键词]体育教育专业 课程体系 教学改革   [中图分类号]G642.0 [文献标识码]A [文章编号]1004-3985(2011)08-0132-02   一、前言   随着社会的不断发展,课程改革的不断推进,以及用人单位对毕业生要求的不断提高,体育教
语言知识可帮助计算机正确地处理自然语言,介词结构知识作为语言知识的一种,对自然语言处理和语言教学研究有很重要的意义。该文基于大规模语料库构建了高质量的介词结构搭配
5G技术已经广泛应用,而智能分布式配电自动化系统也开始着手致力于用5G技术替代分布式有线通信,节省系统成本。但是由于5G技术依然无法避免无线通信诸多因素的相互干扰导致分
文中提出了一种采用时域测量技术的双绞线测试系统方案。本系统能测试双绞线的衰减,近端串扰、线缆长度等重要参数,并能对双绞线进行故障定位和诊断。该系统有很大的实用性和潜在社会效益。
切换技术是移动IP的关键技术.对切换技术的改进,可有效提高移动IP的性能.平滑切换解决了移动IP的丢包问题,文中分析平滑切换中仍然存在的问题一时延和包的重复,通过延长移动
文中通过建立大地和中性点间电压uN'N的数学模型,提出了能够初步判断中性点不接地交流电网绝缘故障相的方法,并用SABER仿真验证了本判别方法的可行性.
俄语视听说课是一门俄语专业基础必修课,是以建构主义理论为指导,以视听型语言实验室的技术为手段,以俄文原版视听材料为教学内容,融视、听、说于一体的教学。文章从视听说课