基于语料库的现代汉语“所”字结构边界及功能识别研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:zhiyouyiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以信息处理为目标,以现代汉语“所”字结构为研究对象,在考察大规模语料的基础上,研究“所”字结构边界及功能的自动识别问题。全文共分为三个部分:第一部分是绪论,确定研究对象,阐述选题的目的和意义,综述“所”及“所”字结构的研究现状,短语边界识别的研究现状,介绍本文的研究思路与拟采用的理论方法,最后交代语料来源。第二部分是正文,包括第二章至第五章。第二章是语料的分类与选取。本章利用国家语委的分词与词性标注软件对所有含有“所”字的语料进行了分词和词性标注的预处理,并根据“所”字的词性对语料进行了分类,选取出研究所要依据的有效语料。第三章是现代汉语“所”字结构边界分析。本章分别对语料中“所”前和“所”后的成分进行分析,进而总结出“所”字结构的左右边界词或相关词,为第五章的边界识别打下基础。第四章是现代汉语“所”字结构功能分析。本章对语料中“所”字结构的句法功能进行了细致的描述,进而总结其形式上的规律,为下一章的功能识别打下基础。第五章是现代汉语“所”字结构边界及功能识别。本章阐述了“所”字结构边界及功能的具体识别步骤,并编制程序实现这些功能。第三部分是结语,即第六章。本章总结全文的研究成果,分析存在的不足和尚需解决的问题,并展望后续研究努力的方向。
其他文献
随着利率市场化改革的推进和金融市场的开放,我国商业银行通过综合化经营来丰富以传统存贷款业务为主的经营结构,以期实现收入构成的多元化。本文通过梳理国内外有关商业银行
目的观察四物汤不同分离部位对3.5 Gy照射小鼠外周血象的影响,发现四物汤补血作用的活性部位。方法60只小鼠常规饲养适应环境后,采用60Co-γ射线3.5 Gy全身一次照射,照射后立
进入新世纪 ,陆上资源面临枯竭 ,人类环境日趋恶化 ,人们把目光投向海洋 ,2 1世纪是海洋世纪。联合国海洋法公约的生效使争取和维护国家海洋权益成为新的焦点。强化海洋意识
本文以《越南学生学习汉语中的英源外来词的情况研究》为题,在对汉语中的英源外来词和越南语中的英源外来词进行对比的基础上,对越南学生学习汉语中英源外来词的情况进行研究
《酉阳杂俎》是一部唐代笔记小说,内容丰富,所记多奇。其四部丛刊本包括了大量俗字,本论文即针对其中的俗字展开研究。论文由四个主体部分组成:一、绪论部分,界定了俗字的定义
<正>"唰、唰、唰……"一串清脆的扫地声把宁静的连队从梦中唤醒。晨曦里,一位老人在挥动着大扫帚,清扫连队广场和主干道,老人清瘦的身躯迎着早晨第一缕阳光显得矍铄而有力,成
期刊
<正>公民的继承权是宪法赋予的权利,受到法律的保护,公民实现继承权的最主要形式就是顺利地继承被继承人遗留的遗产,这同样也是《继承法》立法的主旨之一。我国现行《继承法
随着30年前认知语言学的兴起,关于隐喻的研究层出不穷。在众多的隐喻研究中,身体隐喻引起了认知语言学家和研究者的关注。然而将身体隐喻与汉语成语结合起来的研究并不多见。鉴
瓦尔特·本雅明(Walter Benjamin,1892-1940)是20世纪德国著名哲学家、美学家。早在20世纪初期,本雅明就预构出大众传媒思想的理论框架,他以艺术生产理论为大众传媒思想的建
目前,国内外对自我修正做了大量研究,众多学者从语言学、心理学和认知科学等角度对话语修正进行了深入探讨,Levelt(1983)和Kormos(1999)分别建立了一语言产出模型和二语言产出模