文本聚类技术的有效性验证

来源 :计算机工程 | 被引量 : 0次 | 上传用户：xfzou32

【摘要】

：

讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC（后缀树聚类）算法和基于Ant的聚类算法进行了实验对比。实验表明，STC聚类算法在处理文本时充

【作者】

：

刘务华罗铁坚王文杰

【机构】

：

中国科学院研究生院

【出处】

：

计算机工程

【发表日期】

：

2007年1期

【关键词】

：

文本聚类聚类有效性验证后缀树聚类 Ant—based Document clustering Clustering validation STC An

【基金项目】

：

国家重点实验室网上合作研究平台基金资助项目（2003DEA5G0407）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC（后缀树聚类）算法和基于Ant的聚类算法进行了实验对比。实验表明，STC聚类算法在处理文本时充分考虑了文本的特性，其聚类效果较好；基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大，其聚类结果与STC相比并不具有优势；在Ant聚类算法中引入文本特性后，可以提高文本聚类的效果。

其他文献

基于小波与ART2网络的实时状态识别

构造出一类用递推公式进行小波变换的小波基，提出此类小波的优化方法，对其时频特性进行了分析。针对传统ART2网络只利用了模式的相位信息而丢失了幅度信息和网络的性能依赖于样

期刊

优化递归小波改进型ART2网络刀具状态在线监测Optimal recursive wavelet Modified ART2 network To

减轻企业负担促进投标诚信——由取消“原件备查”引起的思考

曾几何时，“原件备查”在招标文件中频繁出现，既是技术标评审的“规定动作”，也是投杯被否决的重要条款，引起各评标专家的高度重视。然而，正是“原件备奇”遮一要求，却在一定程度上

期刊

减轻负担原件备查投标诚信

基于MPLS实现IPv6网络QoS的新机制

通过分析IPv6的QoS特性以及DiffServ和MPLS技术，提出了在MPLS平台下通过TC字段实现IPV6网络QoS的新机制。该机制简化了网络结构设计，更容易提供端到端的QoS。试验结果表明，新机

期刊

IPV6QOS多协议标签交换区分服务IPv6 QoS MPLS DiffServ

一个基于Petri网的Web服务组合模型

作为企业应用集成的重要手段，Web服务组合需要建立可靠的表达和分析方法。因此，基于Petri网技术定义一个Web服务组合模型，将组合Web服务的要索映射到Petri网结构。利用Petri网提

期刊

WEB服务WEB服务组合PETRI网Web services Web service composition Petri nets

DTBF模型的流量负载均衡研究与实现

针对目前网络工程中负载优化困难的问题,基于令牌调度方法提出了一种改进的动态令牌分配调度模型DTBF,实现了实时流的流量整形,推导并设计了动态分配令牌的优化算法以解决逻

期刊

流量整形动态令牌分配服务质量负载均衡traffic shaping token bucket dynamic distribution QoS l

TCP Offload系统的设计与实现

网络带宽的迅速发展使主机协议处理开销成为系统整体性能的瓶颈。为了提高网络应用的性能、降低主机系统的资源占用，该文采用网卡子系统分担主机的网络包收发和TCP协议处理，设

期刊

TCP下移高速网络处理协议栈TCP offload high-speed network processing protocol stack

城市公共服务供给侧改革的市场机制——资本合作

资本合作是混合所有制的一种资本表现形态，包括公共资本与公共资本间、公共资本与私营资本间、私营资本与私营资本间（即民营企业间）的资本合作。其中，公共资本间、公共资本与私营

期刊

公共服务供给资本合作市场机制公共资本私营资本改革城市公用事业领域

清水型生态构建技术计价难点及其计价研究

清水型生态系统构建技术作为一种修复并构建可持续水生态系统的工程技术,在水环境综合治理工程中得到了越来越广泛的应用,但是作为新型技术其计价问题,特别是沉水植物栽植计

期刊

清水型生态系统构建技术沉水植物综合单价Clean water ecosystem construction technologySubmerged pl

河南：将在政府采购等事项中实施随机抽查

为深入贯彻落实《河南省人民政府办公厅关于印发河南省推广随机抽查规范事中事后监管实施方案的通知》精神，推进财政监督检查随机抽查，增强执法效能，

期刊

河南省人民政府办公厅抽查随机政府采购财政监督检查事后监管执法效能印发

评定分离“热”中的冷思考

<正>招标投标制度在我国经历了30多年的发展,在不断健全完善的同时,也出现了诸如围标串标、虚假招标、规避招标等一些亟待解决的问题。一些业界人士在分析研究问题根源时,把

期刊

部门规章第三方评审机构中标人招标人招标投标法公权力上位法招标文件编制招标投标活动招标代理行业定标方法冷思考

文本聚类技术的有效性验证

与本文相关的学术论文