含疑问代词“哪里”和“谁”的隐性否定识别研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:wanchh520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
疑问代词的基本功能是表询问,有时候也可以表任指或在反问句中表隐性否定,这种多义性会给计算机理解自然语言造成一定的困难。研究疑问代词在句中的隐性否定用法,帮助机器更加准确地理解句子的整体含义,对机器翻译、情感分析等自然语言理解的任务具有十分重要的意义。本文以“哪里”和“谁”为研究对象,通过大规模的语料观察,分析它们的隐性否定用法和非否定用法,从固定搭配、句法位置和上下文特征方面总结出具有可操作性的规则,为“哪里”和“谁”的语义消歧提供参考。文章以北京语言大学语料库中的文学语料、微博语料和对话语料为训练语料,逐条分析疑问代词“哪里”和“谁”的用法。在固定搭配方面,总结隐性否定固定搭配和非否定固定搭配的形式,形成相应的固定搭配字符集。在句法位置方面,将句法位置的考察限定在单句和分句的范围内,分为句首、句中、句尾和独立形式,分别考察疑问代词隐性否定用法和非否定用法在不同位置上的分布情况。在上下文特征方面,以邻接词的词性作为切入点,结合共现字符、邻接字符串及固定搭配,提取疑问代词作为隐性否定成分和非否定成分的形式特征。通过对语料的考察与分析,发现当“哪里”的上文为名词、代词、部分动词、转折连词、名词性短语等,并且后接动词、介词、数词、部分副词、部分代词等时,“哪里”被判定为隐性否定用法的可能性更大;当“谁”的上文为代词、部分动词、部分副词、部分连词等,并且后接名词“人”、量词“个”、部分动词等时,“谁”被判定为隐性否定用法的可能性更大。之后,采用正面识别与反面排除相结合的策略,总结出多条识别规则。按照固定搭配规则、句法位置规则、上文特征规则和下文特征规则的顺序依次执行,并且画出详细的识别流程图。再以第三方语料库中的文本为测试语料,采用人工核对的方法对规则进行验证。实验结果表明,CCL语料库和语料库在线的识别效果较为理想,F值均达到92%以上;MLC语料库识别效果欠佳,F值相对较低,规则提取不够充分,有待进一步研究。
其他文献
连续刚构桥是我国大跨径混凝土桥的主要桥型,具有经济性能及施工稳固性好,养护工作量小的特点,常用于大跨、高墩的结构中。此类桥梁在通车运营一段时间后,普遍出现跨中下挠远超理论计算值及梁体开裂等病害,且下挠及裂缝均随时间发展而不断增长。部分建成较早的连续刚构桥受当时桥涵设计规范、施工工艺水平的限制,病害尤为严重,严重影响结构的使用安全和桥梁的正常运营,需要实施加固处理。本文结合某EPC总承包管理模式的连
广西甘蔗资源丰富,不同糖分甘蔗的甘蔗尾水溶性碳水化合物(Water-soluble carbohydrates,WSC)含量不同,而WSC是青贮过程中的重要发酵底物。本试验旨在探究不同WSC含量甘蔗尾青贮不同时间后发酵品质差异以及添加柠檬酸或双乙酸钠对其青贮品质和微生物多样性的影响,以期为广西地区调制优质甘蔗尾青贮饲料提供科学依据。研究内容及主要结果如下:(1)青贮时间对不同WSC含量甘蔗尾青贮品
近年来,我国各级政府及其部门高度重视教师队伍建设,并把师德师风及其建设放在重中之重。然而,目前在一些地区和学校,教师职业倦怠和师德失范行为现象时常发生。这对教师队伍的整体形象及其建设产生了重大的负面影响。研究表明,教师职业倦怠会影响教师行为。那么,教师职业倦怠和师德失范行为之间存在何种关系?这需要进一步调查和研究。本研究采用问卷调查法,以湖北省武汉市和襄阳市两地的1475名中小学教师为样本,运用《
李骏(1931-2019)是我国20世纪50年代公派留苏美术家。与同时代画家相比,他在留学期间创作的大量作品和临摹画,被作为范本广泛传播,为新中国美术事业的建设和发展辛勤耕耘。但在近些年美术史的书写当中,他总是以群体形式出现,却淡忘了其个人的贡献与付出。当我们回顾他不同阶段的作品时,像是诉说着20世纪至今中国油画艺术的升沉起伏,因此对李骏艺术的考究就会显得弥足珍贵。基于宏观史料记载与少许的前人评介
近年来,随着城市建设的不断推进,城市交通体系建设也进入了高质量发展阶段,出行者的个性化需求得到了极大的满足,出行方式呈现出多元化,定制化的发展态势。出行者对出行方式有了更多的选择,出行活动较以前也更为复杂。为了能不断优化城市交通服务,提高城市出行效率,对出行需求方的研究就显得尤为重要。本文旨在通过两个模型的建立,对城市居民出行方式选择行为进行研究。第一个是出行方式影响因素的结构方程模型,揭示出行方
Lakoff&Johnson的代表作《我们赖以生存的隐喻》标志着人们对隐喻的认识由修辞学领域拓展到认知领域。既然隐喻是人类的一种基本认知方式,那么关于隐喻的研究就不能仅限于文字领域,其它交际符号如图像、声音、手势等也可以用来构建和表达概念。批评隐喻分析旨在通过对话语中隐喻的批评分析,揭示话语背后隐藏的意识形态和权势关系。然而现存的多模态隐喻的研究多数强调两域之间的系统映射及模态间的互动关系,并没有
受社会经济和文化生活等因素的影响,我国非物质文化遗产的生存环境发生了很大的改变,手艺传承也面临“人亡技消”的严峻挑战。与此同时,非遗题材纪录片以动态的影像形式记录与非遗相关的客观事实,促进了非物质文化遗产的保护与传承。随着国内纪录片创作意识和叙事手法的不断改进,以《传承》、《守望》、《留住手艺》等为代表的大批新时代优秀非遗题材纪录片从文化记忆的视角切入,在当下社会力图以一种符合新时代审美的叙事形式
经济学的发展已经有几百年的历史,马克思政治经济学毫无疑问是经济学史的一块瑰宝。在应对经济危机时,西方资本主义国家大多数求救于“凯恩斯”“弗里德曼”等人,而对马克思的相关理论熟视无睹。在新冠肺炎疫情肆虐全球的今天,以美国为首的西方资本主义国家,在经历了历史上最大规模的货币超发后,面临40年来最严峻的通胀考验,也面对着可能是历史上最大的金融市场泡沫的挑战。这种两难的境地让他们已经无法从经典的经济学理论
随着我国社会经济的快速发展,我国社会主要矛盾发生了很大的变化,以人民为中心的新发展理念强调,人民对美好生活的向往和社会经济发展不充分不平衡之间的矛盾只能通过发展来解决。2017年,我国明确提出通过以人民为中心的高质量的发展来解决我国主要矛盾,实现社会主义现代化强国目标。强调今后一段时期把经济工作的重点必须放在高质量发展上。此后的每一次中央经济工作会议,在研判国际国内经济形势的基础上,围绕着高质量发
数据法律属性的不同决定了其保护路径的差异性,在研究数据爬取行为竞争法规制主题时对“数据”的外延进行限定是基本前提。企业数据概念的析出是数据爬取竞争法规制主题下的第一个分类目标,在企业数据概念之下还应当再有细分来匹配数据爬取行为的反不正当竞争及反垄断规制路径。反不正当竞争法在国内当下的司法实践中被作为规制数据爬取行为的主要法律依据,但根据目前反不正当竞争法最新修改版本的内容来看,其尚未将数据不正当竞