一种文档聚类新方法

来源 :第十六届全国数据库学术会议 | 被引量 : 0次 | 上传用户:zyjwxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出一种文档聚类新方法。其基本思想是利用数据挖掘,发现文档库中针对文档或词的关联规则,然后利用超图划分算法对关联规则超图进行划分,从而实现文档聚类。文中给出了两种具体的实现算法:一种是利用倒排文件进行文档关联规则挖掘;另一种则是基于文档向量模型实现词(组)关联规则发现。
其他文献
关联规则是这样形式的陈述“对于关系中90℅的行,如果某行在集合W中某些列的值为1,那么在列B中的值也为1”。该文介绍了一种基于数据库之上连续转换方法的算法。该方法通过对以
时光的泪珠儿,敲打着心弦;思念曾经,冰封着内心;朋友的朋友,飞奔着离开.往事若流云,一点一滴地被微风吹过深深的峡谷,飘向世界的极端.冰封着内心.冰封着灵魂深处的记忆.眼泪
今天的阳光真好,柔和的阳光洒在人身上,是那么的舒适温暖。这么好的一天,干些什么呢?我徘徊在房间里,低头沉思着。不经意地摸到了柜子,我仔细一看,柜子上堆积了好多的灰尘。
发现关联规则是数据库挖掘中的主要方法之一,现有的关联规则算法,有的需要对数据库进行多次访问,或采取随机采样方法,以降低精确性为代价来减少遍历次数。该文针对大型商场的销售
[目的]寻找一种适合树体注入的高效、安全、快速治疗果树缺锌生理病症的锌制剂。[方法]选择3年生及以上苹果、梨、桃、葡萄树,研究其对打孔塞入的3类6种含锌物质的吸收情况及
讨论了在大数据库上挖掘关联规则的抽样算法。挖掘关联规则是数据挖掘的重要问题之一。为了找出关联规则,几乎所有的算法都需要扫描数据库许多遍。在算法分析时,对于大数据库,I/O时
会议