最大距离法选取初始簇中心的K-means文本聚类算法的研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:emulate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-m
其他文献
期刊
上市公司产业并购基金作为一种新型模式,符合产业发展与整合的需求。一方面发挥私募股权投资机构的融资能力和专业的管理能力,另一方面发挥上市公司的行业整合能力和资源运用能
引入ISO9000族质量标准,对于创新党建工作、拓宽党建工作渠道、提高党建工作标准和质量,有着不可估量的现实意义。 The introduction of ISO9000 family quality standards
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
行政行为说明理由是指行政主体在作出行政行为时,对相对人或者利害关系人的权益产生不利影响的,除法律特别规定外,均应当向相对人或利害关系人说明作出该行政行为的事实因素,法律依据及裁量因素的考量。文中从说明理由的概念、范围、例外、方式、内容、要求等多个角度探讨了行政行为说明理由制度的完善路径,并穿插比较域外关于行政行为说明理由的规定,希望对我国的行政行为说明理由制度发展有所裨益。针对完善说明理由制度,行
建议和裁决的执行是WTO争端解决机制的重要组成部分,而且是实现世界贸易组织宗旨或目标的重要手段,而DSU所设置的合理期限制度则是促进建议和裁决执行的重要手段。确定合理期
针对基于约束得分的特征选择容易受成对约束的组成和基数影响的问题,提出了一种基于约束得分的动态集成选择算法(dynamic ensemble selection based on bagging constraint sco
在社会化媒体时代,关系成为营销的战略资源,企业实施关系营销包括:其一、以情感维系关系,其二、以渠道整合关系,其三,以数据转换关系。 In the era of social media, the re
期刊