【摘 要】
:
针对中文零指代问题,从篇章视角进行理论分析,并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus,CDZC)的构建工作。首先,整理和分析已有的理论研究以及语料资源,探
【机 构】
:
苏州大学计算机科学与技术学院自然语言处理实验室
【基金项目】
:
国家自然科学基金(61472264,61751206),国家重点研发计划(2017YFB1002101)资助.
论文部分内容阅读
针对中文零指代问题,从篇章视角进行理论分析,并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus,CDZC)的构建工作。首先,整理和分析已有的理论研究以及语料资源,探究篇章层面中文零元素语料库标注的必要性。然后,采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式,完成CDZC语料库的构建。最后,对该语料库进行一系列详细的统计分析。结果表明,CDZC能够充分反映出中文零元素省略的语言特点,为相关研究提供语料资源支持。
其他文献
(三)孵化一、池中孵化1.孵化池:一般可选择1~2亩水面为孵化池。水深1米左右,保持水质清洁。要进行清塘消毒,以防敌害侵袭鱼卵及幼鱼。2.受精卵的孵化及管理:粘附受精卵的鱼巢
目的应用生物信息学方法筛选与早期胃癌预后相关的核心基因。方法以"early gastric cancer,Homo"为关键词,从GEO数据库中下载人类早期胃癌基因芯片数据集(GSE3438、GSE55696)
<正>女性,对于男性来说,是一种双重存在:既含羞文雅,又具官能刺激;既可以激发男人的审美情感,又容易引起男人的拒斥心理;既使男人萌生爱恋之心,又使男人产生鄙薄之念。"女性,
引进TCK钢丝绳检测仪对钢丝绳的使用过程进行在线安全检测,将检测结果作为钢丝绳日常维护、处置的科学依据,从而杜绝了钢丝绳安全管理中的各种弊端。
介绍了一种简便快速测定LRZ系列乳化炸药组分的分析方法.采用该方法可以缩短测定时间,节省试剂及仪器成本且测得各组分含量与实际含量非常接近.
目的:分析web of science(WOS)核心数据库中"建模/仿真与体育"领域的发展情况,梳理其研究进展,为相关领域的研究提供借鉴和参考。方法:以WOS数据库中所收录的1741篇相关文献
本文针对国内在较长时间以来,在人口老龄化问题研究中存在的一些理论上混乱、技术上不规范的重要问题,诸如,老年人口年龄下限的界定问题,人口老龄化的衡定模式评价方法等问题,通过
支气管哮喘是一种常见的呼吸系统疾病。本病易于反复发作,迁延难愈,极大的影响了患者的生活质量。祖国医学属于"哮病"的范畴,近年来,中医治疗支气管哮喘的进展较快,各界相关