中文文学作品中的社会网络构建与分析

来源 :浙江工商大学 | 被引量 : 1次 | 上传用户:wangyiming1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络空间中的信息量呈爆炸式增长,我们能够共享到的信息越来越多。然而,这些信息通常以多种不同的数据形式存储于网络空间中,阻碍了数据的获取及处理。因此,如何有效地获取及处理这些数据,进而从庞大的数据中挖掘有用的信息,并加以分析成为了很多领域的研究重点。人物关系网络的构建与分析是其中一项十分重要的研究内容,对于侦察情况分析及资源分析、检索等具有重要意义。中文文学作品是一类重要的信息来源。中文文学作品中人物关系的分析与挖掘,对于把握作品情节的展开,进而更好的理解该作品具有重要的意义。当前对文学作品中的人物关系网络研究已经有所开展,但仍然存在一些问题,主要包括:1)现有工作仅关注文学作品中的一小部分人物,未能比较完整地构建出文学作品中的人物关系网络;2)现有工作所研究的内容主要集中在人物网络结构和角色分析等问题,并未关注人物关系网络中关键人物的识别工作,然而关键人物对于理解作品具有重要的意义。有鉴于此,本文以《三国志》为研究载体,研究中文文学作品中人物之间社会网络的构建与分析技术,深入地分析该社会网络的结构特征,并挖掘出重要人物,从而为定量地分析文学作品提供支持。研究内容主要包括三个部分:(1)《三国志》人物关系网构建本文采用自然语言处理技术对《三国志》文本进行分句、分词及词性标注等处理。同时,有别于现代白话文的识别,本文通过添加自定义词典对古代文言文文本进行精确分词处理。在文言文处理中,人名消歧义是一个十分重要的环节。因为同一个人物经常会用代词多次指代,所以本文采用指代消解来避免人物重复读取的错误。人物关系的抽取是本文最关键的一步,本文将通过定义相关规则将文本进行结构化处理,进而识别人物关系。(2)《三国志》人物关系网的结构分析《三国志》人物关系网形式化的表达了三国人物及他们之间的各种交互关系。通过分析网络的静态结构有利于挖掘潜在的信息,从而为更好地理解《三国志》提供支持。本文将引入社会网络分析中的各种常用统计参数,如度分布、网络密度、模块度、平均路径长度、聚类系数等相关复杂网络指标,分析三国人物关系网的静态结构,进而量化地分析三国社会的结构特征、历史格局的形成因素及变化规律。(3)三国关键人物挖掘关键人物对于历史的形成与发展具有重要意义。因此,识别《三国志》中的关键人物对于分析《三国志》具有重要意义。本文采用加权网络的k-核分解方法来挖掘《三国志》中的重要人物,并与社会网络的其它几个中心性指标进行对比分析,验证方法的有效性。关键人物的识别可以帮助读者更好的理解历史情节的形成与发展。此外,挖掘出来的关键人物可以与历史学研究者们关于三国历史的研究成果相比较,这对于历史史实的分析和验证,以及历史趋势的走向与发展具有重要意义。本文开展的是文学和社会网络的交叉研究,创新主要在于构建了比较完整的文学作品人物关系网络,并比较全面的分析了该类人物关系网络的结构特征,并提供了一种挖掘文学作品关键人物的方法。本文的工作有助于用户理解其不熟悉的文学作品,可用于理解普通文学作品中的故事情节,同时对史料的研究也有辅助作用。
其他文献
近年来,随着网络和物流业的发展,网络购物在人们的日常生活中越来越常见,许多人都开始进行网络购物。因此,越来越多的电商购物平台开始进入人们的视野。对于企业而言,线上网络购物平台的开辟帮助企业开辟了一块新的市场,企业能在这个市场中寻求到更多的消费者需求。但是,线上平台的兴起对于传统的线下零售业造成了极大的冲击。由于网络购物平台与网络支付方式方式的发展,越来越多的人习惯了线上渠道购物的方便与快捷,一些人
图像生成是当下计算机视觉领域的一个重要分支,也是近年来的一大研究热点。另一方面,大熊猫文化是中国文化的符号,在国际文化中有着举足轻重的作用。在新兴的数字文娱产业中,大众创作者们对熊猫形象设计的门槛较高,难以对其憨萌可爱之处进行还原,因此熊猫文化在产业中比重较低。针对创作过程中的困难,本文依据文娱创作的需求与创作流程,基于现有的图像生成技术,提出了对通过线条绘画生成熊猫图像的方法,为创作者们提供直观
不同于其他类型的FPGA,反熔丝FPGA是通过编程其内部的反熔丝单元而实现整个芯片的配置。由于反熔丝单元具有一次可编程性,所以反熔丝FPGA是OTP器件。相比于其他类型FPGA,反熔丝FPGA的可靠性,安全性和抗干扰能力更为优秀,所以较多地运用于航空航天与军事领域。反熔丝FPGA测试过程中,需要外界提供多组高压信号,并满足特定的时序要求,因此其不适用于市场上通用的芯片测试平台。本文设计了一套针对于
随着互联网技术的日新月异、数字媒体的信息冲击和互联网商品交易平台的普及,消费者的日常生活状态受到数字化的影响越来越大,零售行业也在过去十年里发生了巨大的变化,移动渠道、社交媒体等的出现对现有的零售商业模式、零售组合和购物者行为带来了巨大的冲击。在新零售的趋势下,零售商巨头们不再是单一的追求线上流量或线下网点的布局规模,而是根据线上线下各自的特性来实现同步发展,形成复合竞争力,进而获取更多的市场份额
大脑是一个非常复杂的神经元网络系统,它由约1011个神经元构成,且每个神经元大约和其它104个神经元通过突触相连接.目前绝大多数研究认为神经元之间的突触连接保持不变,然而真实脑神经系统中,突触连接随时间不断发生变化,即神经突触具有可塑性.因此具有突触可塑性的神经元网络更接近真实的脑神经系统.另外,由于神经递质的随机释放与离子通道的随机开关等因素,神经元也处于噪声环境中.鉴于此,本文首先通过构建具有
随着零售行业的线上销售越来越普及,消费者享受着线上模式带来的诸多便利,与此同时,无法在线上购物前真实的感知商品,使消费者可能面临额外的退货费用,这也将导致零售商承担大量的退货成本。B2C模式下,零售商为刺激消费往往会提供宽松的退货政策,加之退货的便利性使得电子商务市场存在较高的退货率,而这些退货中绝大多数都是整件退回商品。实际生活中商品以单件商品和组合商品两种形式存在,但目前的退货很少考虑商品的存
随着多媒体服务的发展,视频和图像已经成为了人们生活中不可或缺的一部分。然而,由于其庞大的数据量,视频和图像信息的传输会消耗大量功耗,缩短移动设备电池的寿命。为了解决这个问题,一般在图像传输之前使用图像压缩系统对数据进行压缩,而离散余弦变换(DCT)通常作为这个系统的核心。但是,DCT是运算密集型的运算,电路直接实现会占用大量的硬件资源,引入较大的功耗,影响整个系统的稳定性。为了简化DCT运算,本文
等值线图又称等量线图,是一种应用广泛的图形。它是以相等数值点的连线表示连续分布且逐渐变化的数量特征,是地质资源信息系统中最基础和常见的数据表示形式。它将数据与图像
近年来,随着动作识别技术在现实应用中需求的不断增加,该技术成为了计算机视觉领域的研究热点。通过对熊猫素材进行动作识别与分类,能够为熊猫文化创作者提供大量丰富、真实
在全球化快速发展的今天,国家之间的经济往来越发频繁,投资与国际贸易活动密集,而由于各种正式与非正式壁垒产生的两国之间的摩擦也越来越多。社会网络通过种群、血缘以及观念信仰连接在一起,验证了国家之间联系的紧密与否,近些年对于两国之间社会网络与贸易之间的研究也不断深入。国际贸易远比国内贸易复杂,中间不仅有关税等贸易壁垒存在,还会有由于语言风俗等不同而产生的非正式壁垒,而社会网络可以通过内部建立信任机制以