论文部分内容阅读
21世纪是一个信息时代,互联网的广泛普及和信息技术的飞速发展在为人们带来方便与快捷的同时,也造成了信息的爆炸式增长,大量杂乱无章的内容充斥着整个互联网,为企业和用户造成了许多困扰。人们无法对海量的内容进行有效的管理,不得不花费大量的时间和精力从臃肿的内容中提取有效信息。因此,如何能够有效地管理这些信息,成为一个非常具有实际意义的研究热点,内容管理的概念也应运而生。内容管理的目的是对各种信息,包括结构化和非结构化数据进行高效的采集、组织和利用,从而达到内容的有效管理和高效利用。内容分类是其中一个非常重要的关键步骤,是对内容进行有效组织管理的重要手段,通过分类对海量数据进行划分和细化,对内容管理具有十分重要的意义。 本文对国内外内容管理系统的研究现状及内容分类方法进行了调查和分析,针对现有内容分类方法的不足,将聚类分析的概念引入内容分类,提出了一种基于聚类的改进的内容分类方法。在此基础上,本文又对内容管理模型进行了深入的研究与分析,并基于该模型设计并实现了一个内容管理系统对该模型进行应用验证。具体来讲,本文的工作可以慨括为以下几个方面:对内容管理中的内容分类方法进行了研究和分析,针对现有内容分类方法的不足,引入了聚类分析的概念;对聚类分析算法进行了深入研究,针对传统K-means算法的不足进行了改进,并与传统K-means算法进行实验对比;基于改进的K-means算法,以文本分类为例,提出了一种基于聚类分析的内容分类方法;对内容管理的各个环节进行分析,并在此基础上对内容管理模型进行研究;实现了一个的内容管理系统,对所提出的内容管理方法进行应用效果分析。 经过验证分析,本文所提出的改进的K-means算法相比传统的K-means算法能够得到更好的聚类效果,在准确率和召回率上均有一定提高,基于改进的K-means聚类算法的内容分类方法可以有效的对文本内容进行自动聚类,具有较好的分类效率和应用前景,对研究内容之间的关联意义及研究内容特征等方面也有着非常重要的意义。本文所提出的内容管理方法在实际应用中得到了验证,基于该方法的内容管理系统运行良好,具有十分重要的研究意义。