基于机器学习的《红楼梦》作者问题研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:lhl1208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《红楼梦》是我国古典文学作品的瑰宝,如果要选一部中国艺术文学作品推向世界《红楼梦》是不二之选,但这部文学巨作的作者归属自其成书200多年以来一直悬而未决,也许正是基于这个原因至今《红楼梦》的作者问题仍是人们关注的热点。毫无疑问,已有许多研究者运用各种分析方法对这一问题进行过认真研究并得出了各种判断结论,在这诸多结论中被大家普遍接受的是:《红楼梦》前80 回由一人所写后40回也由一人所写,但前后不是同一人。考虑到前面大多数的分析研究都是基于比较传统的统计学习方法(比如假设性检验),在此基础上对《红楼梦》作者问题所下的各种结论均是缺乏一定的可靠性,又考虑到伴随着大数据时代的来临机器学习被广泛应用,抱着“与时俱进”与改进实验分析技术的想法,本研究打算借助R语言对《红楼梦》进行文本分析并按本文作者所创造的甄选原则选取出100个高频词汇作为作者写作风格的用词特征,以此来获取实验数据;再从机器学习的Bagging、Adaboost、Rotation Forest三个角度出发分别对《红楼梦》作者归属问题进行分类研究。分析表明,Bagging、Adaboost、Rotation Forest的实验结果呈现出一致性,即《红楼梦》前80 回与后40回在写作风格上有明显差异,从技术角度确定了《红楼梦》前后由不同两人完成,运用信息技术手段佐证了大家对《红楼梦》的普遍认识。
其他文献
目的比较和评价B超和CT扫描两种影像学方法在肾上腺转移瘤诊断中的作用.方法收集22例肾上腺转移瘤病例,均有B超和CT资料,并进行对比分析.结果22例肾上腺转移瘤共28个病灶,B超
目的 评价加替沙星治疗下呼吸道感染两种方案的经济学效果。方法 将68例下呼吸道感染患者随机分为加替沙星静脉滴注组和加替沙星静脉—口服序贯疗法组,观察临床疗效并作成本—
<正>司徒氏普罗威登斯氏菌致肛周脓肿及败血症,临床上病例罕见、该菌毒力强、发展迅速、多重耐药、疗程较长,易误诊及漏诊。我科近期收治1例,现报告如下。1病例介绍患者,女,1
目的探讨经阴道穹隆局部注射抗生素治疗盆腔炎性包块的价值。方法对56例盆腔炎性包块患者在静脉应用敏感抗生素的同时配合包块局部注射1%利多卡因5ml+地塞米松5mg+α-糜蛋白酶40
多尺度方法在许多科学与工程问题上有着广泛的应用,尤其在大型非均质油藏数值模拟中,由于其计算方法具有很强的并行性,因此称为一种十分有效的方法。流线模拟作为油藏数值模
编者按:吴健雄(1912—1977)是世界著名杰出物理学家,对20世纪实验物理包括验证杨振宁、李政道提出的“宇称不守恒”和美国制成第一颗原子弹有重大贡献,被誉为“核物理女皇”和“中国居里夫人”。她的丈夫袁家骝(1912—2003)也是享有国际声誉的物理学家,在高能物理的研究和应用上也有重大成就。  吴健雄逝世后,遗体不在美国落葬,选择叶落归根,埋骨于她父亲创建的浏河明德中学内具有科学色彩的“吴健雄