极大熵球面K均值文本聚类分析

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:foreverfreedom5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于极大熵理论的球面K均值文本聚类算法ME-SPKM.该算法利用了传统文本聚类算法SPKmeans中使用的余弦相似度度量,进而引入极大熵理论构造了适合文本聚类的极大熵目标函数.对文本数据的实验证明了极大熵球面K均值文本聚类算法取得了比传统文本聚类算法更好的聚类效果.
其他文献
许嘉璐先生说:“如果我们解决了小学生识字难的问题,使识字难变为不难,其意义并不比放一颗卫星小。”这就说明在小学语文教学中识字是第一大难题。
市场经济的新问题:人的机会主义行为倾向及其制约机制卢现祥人的机会主义动机、行为及其产生的根源在西方新制度经济学家看来,人的机会主义行为倾向是指人对自我利益的考虑和追求,意思是,人具有随机应变、投机取巧、为自己谋取更大利益的行为倾向。首先,人的机会主义...
中文语言自身的特点决定了从中文自然语言文档中获取知识是非常困难的.尽管目前对中文的命名实档体识别(简称为NER)已经取得了较好的效果,但是如果不借助同义词表或者类似Wor
李杜七古异同论葛景春李白和杜甫的七言古诗(包括七言、杂言乐府歌行)是唐诗七古创作的最高成就,即使是后人也无出其右者。明人胡应麟曾对唐代的七言歌行有一个总评:“唐七言歌行
随着我国教育理念的不断发展,建立高效课堂已成为教师教学必不可少的目标。而国家越来越重视教育,为教育设备改善下拨了大笔的教育资金,争取让每一个教室都配备了多媒体设备
提出一种新的网络蠕虫传播模型,并基于生物免疫原理提出了成熟良性蠕虫、记忆良性蠕虫和疫苗良性蠕虫新概念,建立了新的主机状态转移关系,运用系统动力学理论和方法,建立了一
文社是组织松散的文学社团,从宣南诗会到后期南社,近代绝大多数文社都属于消闲性质,其成员以传统的文学样式抒发旧式文人的闲情逸致。日据时期的台湾诗社一度畸形繁荣,但也逐渐走向消闲,近代文社所体现的,不仅是文人与文学的惰性,而且是传统文化的惰性,这就使旧式文社逐渐沧为历史发展相悖的文化形形态,与旧文学一起走向终结,以致在五四大潮中迅速被洋溢着青春朝气的新式文社所取代,中国文社史也由此揭开了新的一页。
施光南是我国当代著名的作曲家,他在各个不同历史时期的作品中,都能确切地展现那个时代的精神风貌,着力表达了一种对祖国、对人民的深情厚谊,对幸福生活和美好爱情的赞美、歌
分析了目前描述逻辑DL的研究现状和存在的问题,特别是动态描述逻辑DDL作为语义Web逻辑基础所存在的问题.针对语义Web需要处理模糊和不精确知识的特点和需求,对DDL进行了模糊