文本聚类技术的有效性验证

来源 :计算机工程 | 被引量 : 0次 | 上传用户:xfzou32
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。实验表明,STC聚类算法在处理文本时充分考虑了文本的特性,其聚类效果较好;基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大,其聚类结果与STC相比并不具有优势;在Ant聚类算法中引入文本特性后,可以提高文本聚类的效果。
其他文献
构造出一类用递推公式进行小波变换的小波基,提出此类小波的优化方法,对其时频特性进行了分析。针对传统ART2网络只利用了模式的相位信息而丢失了幅度信息和网络的性能依赖于样
曾几何时,“原件备查”在招标文件中频繁出现,既是技术标评审的“规定动作”,也是投杯被否决的重要条款,引起各评标专家的高度重视。然而,正是“原件备奇”遮一要求,却在一定程度上
通过分析IPv6的QoS特性以及DiffServ和MPLS技术,提出了在MPLS平台下通过TC字段实现IPV6网络QoS的新机制。该机制简化了网络结构设计,更容易提供端到端的QoS。试验结果表明,新机
作为企业应用集成的重要手段,Web服务组合需要建立可靠的表达和分析方法。因此,基于Petri网技术定义一个Web服务组合模型,将组合Web服务的要索映射到Petri网结构。利用Petri网提
针对目前网络工程中负载优化困难的问题,基于令牌调度方法提出了一种改进的动态令牌分配调度模型DTBF,实现了实时流的流量整形,推导并设计了动态分配令牌的优化算法以解决逻
网络带宽的迅速发展使主机协议处理开销成为系统整体性能的瓶颈。为了提高网络应用的性能、降低主机系统的资源占用,该文采用网卡子系统分担主机的网络包收发和TCP协议处理,设
资本合作是混合所有制的一种资本表现形态,包括公共资本与公共资本间、公共资本与私营资本间、私营资本与私营资本间(即民营企业间)的资本合作。其中,公共资本间、公共资本与私营
清水型生态系统构建技术作为一种修复并构建可持续水生态系统的工程技术,在水环境综合治理工程中得到了越来越广泛的应用,但是作为新型技术其计价问题,特别是沉水植物栽植计
为深入贯彻落实《河南省人民政府办公厅关于印发河南省推广随机抽查规范事中事后监管实施方案的通知》精神,推进财政监督检查随机抽查,增强执法效能,
<正>招标投标制度在我国经历了30多年的发展,在不断健全完善的同时,也出现了诸如围标串标、虚假招标、规避招标等一些亟待解决的问题。一些业界人士在分析研究问题根源时,把