特征加权距离与软子空间学习相结合的文本聚类新方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:Monalisacode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以
其他文献
预测模型标记语言PMML正被许多数据挖掘组织作为标准化的数据挖掘模型描述语言.然而,由于数据挖掘技术的不断发展,参与建立PMML的数据挖掘厂商的经验有差异,PMML本身含有的大
烟雾在我们生活中随处可见,它千变万化、姿态各异,在我们的眼前飘然而过。然而,要想凝固烟雾的每一个瞬间来细细体味,却不是一件容易的事情。庆幸的是我们有了数码相机,于是我们能
在手机中,说到998这个型号,人们定会立刻联想到至今仍在手机市场上打拼的摩托罗拉(MOTOROLA)V998,这员老将不啻为一个传奇,而身为新军的易美手机也将新近推出的一款手机命名为EMOL9
目的中西医结合治疗甲型H1N1流感病人的护理体会。方法将我院2009年9~11月收治的甲型H1N1流感病人的治疗护理予以总结。结果 14例甲型H1N1流感确诊病例及158例临床诊断病例经
网关口令认证密钥交换协议允许用户和网关在服务器的协助下建立起一个共享的会话密钥.网关口令协议适用于无线通信环境,如GSM和3GPP等.已有的网关口令认证密钥交换协议大多缺乏