自动确定单词-文档谱聚类最佳聚类数目的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:lfq_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大多数的谱聚类算法缺少聚类数目的问题,提出一种自动确定最佳聚类数目的单词-文档谱聚类方法.该方法从多文档集合对应的单词-文档矩阵出发,利用形态学对矩阵进行转换、过滤,通过特征间隙确定最佳聚类数目.主要过程包括三个阶段:第一阶段将单词-文档矩阵转换成聚类数目趋势图像,第二阶段采用图像处理技术对灰度图进行过滤.第三阶段通过计算过滤后的灰度矩阵的第一个极大特征间隙所在位置得到最终的最佳聚类数目.实验证明,该方法不仅能评估最佳聚类数目,而且能在一定程度上提高单词-文档谱取类方法的准确性. Aiming at the problem that most spectral clustering algorithms lack the number of clusters, a word-document spectral clustering method is proposed to automatically determine the optimal number of clusters.This method starts from the word-document matrix corresponding to multiple document sets, The main process consists of three stages: the first stage transforms the word-document matrix into the trend number of the clustering number, the second stage uses the image processing technology to calculate the gray number of gray The third stage obtains the final optimal cluster number by calculating the location of the first maximal feature gap of the filtered gray matrix.The experiment proves that this method not only can evaluate the optimal cluster number but also To some extent, it can improve the accuracy of word-document method.
其他文献
选3只健康白山羊,手术安装瘤胃瘘管后,在日粮中添加不同量的硫酸钴,研究钴的不同添加量对山羊瘤胃微生物VB12合成量的影响.试验共分4期:对照期(饲喂基础日粮);试验1期(基础日
由于低碳建筑理念已经得到了公众的广泛重视,促进了低碳建筑的不断创新发展.对于现代建筑设计来讲,低碳建筑设计理念是实现建筑节能环保的重要途径.因此建筑设计师应该用更加
介绍多功能电能表应具有的基本功能,多功能电能表的工作原理、硬件原理框图和控制程序流程图.
期刊
7月8日,互联网安全保护领域首屈一指的Check Point软件技术有限公司宣布推出一个基于诺基亚硬件,结合Check Point R70~(TM)安全网关软件的IP安全设备系列。通过软件刀片架构,新的IP安全设备的标准设计是配备了Check Point最新的入侵防御系统(IPS)软件刀片。全新Check Point的IP安全设备系列可为企业提供一套全面集成的方案,同时享有新的技术支持计划,从而降
“比起西班牙,我更喜欢拉丁美洲。西班牙文化给人的印象是阴郁的,拉美文化则更欢快……”前不久,我初识来我们学校讲课的勒克莱齐奥先生,和他用西班牙语进行了一次非常愉快的对谈。我特别留意到,这位诺贝尔文学奖得主用“阴郁”(sombrío)这个词来描述西班牙文化,以之与同样使用西班牙语的西语美洲文化相区别。事实上,一个暗色调的乃至黑色的西班牙,是欧洲人对这个地处西南欧一隅的国家长期保有的印象。当西班牙帝国
期刊
用MDVgB重组痘苗病毒RVV-gB、HVT冻干苗、痘苗病毒WR株经腹腔分别免疫3组1日龄SPF鸡,15日龄攻GA株强毒,且每组在攻毒前1天,攻毒后2,4,5天各采脾脏1只,并以PHA为有丝分裂原检
是农业部统一设计、监制的动物防疫证照之一.但由于从第一条到第五十八条没有提到,更没有对应用范围作明确的说明.这样就造成了各地对的应用及使用范围认识、理解不一,出现了
多级生产批量计划(multilevel lot-sizing,MLLS)问题是物料需求计划(material requirements planning,MRP)系统中的关键问题,已被证明是NP难问题。Scattersearch(SS)算法是一种亚启发式算法,其应用范围已涉及优化领域中的许多NP难问题。扩展了SS算法的应用范围,采用结合变异算子的混合SS算法(hybrid scatter sear