当代汉语文本言语特征系统提取研究

被引量 : 0次 | 上传用户:fg1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“基于网络的过程性创新人才评价与选拔系统”(简称“网络评价系统”)项目由清华大学招生办公室主办,目的是探索更加科学的考生评价测试模式。为提高“网络评价”的效度与信度,该项目专门开发了“网上风格识别系统”,目的是希望通过这一系统测试学生网上提交的作品的真实程度。本文以语料库语言学、数理语言学、语言风格学等知识为理论依据,运用归纳、演绎、定量、对比等研究方法,试图提取区别意义显著的言语特征,并通过对言语特征的分析和综合考察,建立可资利用的数据模型。从而对特定学生的语言风格进行识别,为“网络评价作文风格识别系统”提供有价值的参考。言语风格具有整体性和系统性。构成言语风格的语言项目本身及其适当的组合形成系统,才能构成具有区别风格特征作用的模型。MD/MF模型是贝博在研究口语和书面语两种语体的特征时建立的。该模型注重语体间整体的异同,从多个维度上对某文本的特征进行描述,强调维度的连续性,对于风格特征的描述更加具体和全面。因此,本文在进行个人风格的言语特征提取和作者身份认定研究时,借鉴了这一分析方法。本文也注意到,贝博的案例主要适用于区分不同“文体”的文本,而本文的研究目的是区分文本在文体上差异不大的情况下作者的言语风格特点。这就必须重点考察如何调整和选择各维度的语言项目、建立什么样的维度和维度体系,才能使之适应并可能最大限度地区分不同作者的个人风格。通过因素分析,本文为个人风格建立了六个维度。分别定义为:“语气张扬化/语气收敛化”维度,“表意繁复倾向/表意简约倾向”维度,“叙述性/交互性”维度,“表述求工倾向/表述求新倾向”维度,“书面化色彩/口语化色彩”维度,“侧重修饰限定性/侧重补充描述性”维度。每个维度都包含一组独特的语言项目,都定义了文体差别不大的前提下个人风格差异的一个方面,都具有独特的表达功能。验证过程是将指定文章代入已有的MD/MF模型,根据指定文本在模型中的分数是否介于其所在文集在该维度得分的区间范围内,从而对二者的作者是否相同做出参考性的判断。
其他文献
近年来,对非酒精性脂肪性肝病的研究颇多,其成因主要有外源性营养因素、理化因素、内分泌因素以及生物性因素,遗传因素和心理、社会因素;在基础研究方面,其相关因素主要有抵
作为博士论文《中国音乐语言用西方乐器习惯用法诠释——论陈怡创作西方器乐曲时中西方观念和技术的融合过程》的一个章节,通过对陈怡《木管五重奏》和《遇》两首作品在音高
在总结同轴电缆线路的施工、运行和维护工作经验的基础上,简要介绍同轴电缆的3种常见类型,分析各种类型同轴电缆的主要特点,重点阐述同轴电缆在工程应用中的选用要点和质量鉴
以北京地区某带转换层的复杂高层结构抗震加固项目为工程实例,采用有限元分析软件SAP2000对原结构与设置复合金属阻尼器后结构进行了动力弹塑性时程分析,比较了罕遇地震作用
在市场经济发展过程中,由于国家社会监督机制不健全、会计人员素质较低等现象使得会计信息失真、会计工作秩序混乱,因此,明确会计责任主体,加强内、外部监督已经成为健全社会
<正>中国可以把美食外交作为文化外交的工具,向全球吃客介绍中国饮食的地区差异和独特的少数民族食品世界上没有几个国家能像中国一样,拥有令人羡慕的饮食历史。时至今日,它
<正>1概述新一代智能化N+1通用型数字电视(调频广播)发射系统的设计思想是,建立一个适用于不同品牌发射机的多路数字电视(调频广播)发射系统,能简单易行、方便快捷地将不同品
<正> 市场营销组合是市场学发展到“营销导向”阶段的重要观念,它是把营销问题作为总体来进行研究的,目的是想通过综合运用各种可能的市场营销策略和手段,以达到企业经营的最
<正> 长期大量施用化学肥料,土壤板结,作物品质下降,但单独使用生物肥料又满足不了作物对营养元素的需要。因此,有机或无机复合生物肥料成为人们关注的一种新型肥料。这种肥