基于频繁关键字共现的诗词风格分类模型研究

来源 :厦门大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zz1976aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高宋词文档分类的精确性,本文在广泛采用的向量空间模型(Vector space model,VSM)的基础上,对分类算法中使用的特征项做了相应的修改,提出了频繁关键字共现的概念.在实验过程中,首先提取了宋词语料库中的关键字,再利用发现关联规则的Apriori算法发现分类时所需要的频繁关键字共现,最后结合关键字和频繁关键字共现,利用最邻近算法(KNN)对宋词文档进行风格分类.实验结果发现,结合了频繁关键字共现的VSM可以提高对宋词风格分类的准确度.可见,频繁关键字共现确实提供了风格分类中所需的更多信息
其他文献
钡剂中毒在临床上甚为罕见,心律失常是其主要表现之一.本院于1994年4月曾收治39例因误食碳酸钡所致钡剂中毒者,现将其临床表现及心电图变化报告如下. Barium poisoning is c
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
与李代数的交叉与渗透是近年来有限维代数表示理论发展的重要特点之一.用Hall代数的方法实现李代数是一个有趣的问题.按照Asashiba的思路,本文利用Tubular代数的根范畴的Ringel
目的:分析晚期产后出血发生原因,借此探讨晚期产后出血的防治.方法:总结55例晚期产后出血患者的临床资料,比较不同原因、不同时间晚期产后出血的发生率.结果:晚期产后出血发
<正> 职业急性碳酸钡中毒国内外报道较少。某碳酸钡生产厂,1990~1992年先后发生8例急性碳酸钡中毒,其中1例死亡。现结合8例中毒病人的中毒表现、抢救治疗谈谈体会。 1 病例资
国有企业的会计信息失真绝大部分可归结为代理问题,即企业代理人侵害委托人权益或欺骗委托人的问题。国有企业的根本问题在于所有者缺位,没有真正委托人参与博弈,再好的制度也会
在西部牧区城镇化进程中,由牧民定居而导致的草原退化问题仍然没有引起足够的重视.甘肃省牧民定居程度居全国领先地位,但仍存在诸多问题.调查资料表明:目前所采取的一些定居