基于特征项权重自动分解的文本聚类

来源 :计算机工程 | 被引量 : 0次 | 上传用户:lioutao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种自动文本聚类方法,应用遗传算法进行全局和快速的文本特征项选择以实现降维处理,引入概率匿名思想,根据文本中不同特征项权重的组合,基于动态规划设计一个优化的多项式时间聚类算法,将文本集划分成适当个数的分区,并对每个分区进行聚类,从而形成初始聚类,采用相同方法对所有初始聚类进行再聚类,形成最终的文本聚类。实验结果表明,该方法既能实现文本特征项的有效选择,又能较好地改善文本聚类效果和性能。
其他文献
<正> 凡由药物所致的排尿困难,潴留于膀胱内者,称药源性尿潴留,临床上并不少见。共性质属于功能性,及时停药多能迅速恢复排尿功能,现分别简述如下。1.麻醉、镇痛药 阿片、盐
基于样例的图像修复算法在修复强结构纹理图像时存在结构不连续现象。针对该问题,提出一种基于样例的图像修复改进算法。在计算数据项时引入结构张量,实现各向异性线性结构的优先级,以决定目标区域修复的先后顺序,使用置信度项和数据项加权和的方式计算优先级。实验结果证明,改进算法对强结构纹理图像的修复效果较优。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在当前社会不断地发展过程中,信息技术发展的比较迅猛,随着信息化的不断深入,互联网给人们带来新的生活方式。在信息时代发展下,各式各样的媒体不断诞生,人们可以通过电视、
传统的最优速度模型(OVM)中驾驶员灵敏度系数均取常数,这与实际情况不完全相符,为此,提出一种基于驾驶员灵敏度系数概率分布的最优速度模型(PDDS-OVM)。该模型根据概率统计理论,
IPO融资超募是我国创业板市场中的普遍现象。超募资金可以为公司拓展主营业务、增加研发支出提供保证。但一些理论研究表明,创业板公司由于规模较小,并不能在短期内快速消化
分析指出Liaw等人的远程用户认证方案(Mathematical and Computer Modelling,2006,No.1/2)容易受到重放攻击和中间人攻击,并且密码修改阶段和注册阶段存在安全漏洞,在此基础上
长期以传统GDP作为衡量经济发展的单一评价指标,造成了一系列环境问题,已不能满足科学发展观的要求。以绿色经济为视角,通过计量方法重新计算包含环境成本的相对绿色GDP,发现环渤
【正】 在西方工业化国家中,借贷资本的运动主要是通过资本市场来进行的。这种资本市场指各类金融机构与证券交易所的总体,它是资金从储蓄者转移到生产者手中的基本途径。由
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield