基于分裂-凝聚的Web新闻主题聚类算法

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:alpaalpa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了实时在线分裂-凝聚聚类算法,该算法分级地构造新闻文本主题,实验结果证实了本文提出的算法的有效性,同时能发现具有不同形状和不同密度的簇.
其他文献
这是本刊半年内再次报道太极,原因很简单,太极正成为最有影响力商人的主流生活方式,它也有可能成为大生意一位中国最著名的商人,一位功夫巨星,一位武林高手凑在一起,他们会干
随着信息技术的发展和普及,各种便携式信息终端(手机,PDA等)的大量涌现和使用,用户需求和市场呼唤使得数据库自然语言查询接口作为人机接口的重要研究领域得到重视.本文就数
《梁思成与他的时代》作者:朱涛著出版社:广西师范大学出版社出版时间:2014-01本书以大量新史料追溯梁思成的心路历程,探讨中国现当代建筑发展与政权更迭和政治运动之间的复
期刊
9月16日,国务院总理李克强主持召开推进新型城镇化建设试点工作座谈会.李克强强调,新型城镇化是一个综合载体,不仅可以破解城乡二元结构、促进农业现代化、提高农民生产和收
期刊
本文首先介绍了CadencePalladium硬件加速/仿真器的基本结构和特点,构建了一个高性能微处理器功能验证的全芯片验证平台的结构,阐述了基于硬件加速器CPU验证平台的实现.该验
本期做客“变量”的是安居客CEO梁伟平。2011年,百度成为其战略投资人。与往期变量不同的是。梁伟平与我们分享了做企业家的心路历程,他说,自卑的人才愿意做企业家,不自卑的
本文给出了如何用XQuery从XML数据中抽取关联规则,分析了Apriori算法的XQuery执行过程.结论表明Apriori算法的XQuery查询过程并不高效,扫描数据库的次数大于基于C++语言的执
本文对广西荔浦锰矿废弃地植被进行了调查研究.共记录了高等植物71种,隶属38个科.优势种包括板栗、老虎刺、桉树、马唐、加拿大飞蓬、山萝花、赛葵等7种植物.由于受人为干扰,
会议
看《非诚勿扰2》,印象最深的,是比北海道还美的业龙湾热带天堂森林旅游区。于是不仅电影叫好又叫座,全国各地的旅客纷至沓来,去趟三亚的预算,
本文提出一种基于关系和半结构化模式语义的XML视图自动化生成方法,主要考虑关系模式中的键和XML模式的层次关系,分为模式转换和数据转换两个阶段.采用本文的方法可以为用户