融合概念对齐信息的中文AMR语料库的构建

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:a348956376
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,
其他文献
Baculoviruses are the only nuclear replicating DNA-containing viruses that encode their own DNA-directed RNA polymerase (RNAP). The baculovirus RNAP is specific
伊斯蒂莎沟封闭剂是一种光敏固化窝沟封闭剂,具有长期有效防龋、不易脱落、耐磨强等性能.近年来,本人运用其对6~13岁127例儿童进行防龋治疗,收到满意的疗效,现报告如下.
<正>2015年中国经济面临前所未有的经济下行压力。官方公布的数据显示,GDP增长速度排在最后六位的分别是辽宁、山西、黑龙江、吉林、河北以及内蒙古。中国经济时报调研组为了
中文分词是中文信息处理的基础,在语音合成、中外文翻译、中文检索、文本摘要等方面均有重要应用。在中文分词的任务中,存在的主要问题在于可用有效特征较少,分词准确率较低,
智库是为政策制定者解决经济、政治、文化、社会和外交等领域重大问题出谋划策的专业机构,也是社会分工精细化和决策科学化、民主化的产物。在当今世界,智库已经成为现代国家治