初始化类中心的增量K均值法及其在新闻事件探测中的应用

来源 :情报学报 | 被引量 : 0次 | 上传用户:pankun001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客观地选择初始聚类中心,既可以用于在线探测也可以用于回溯探测,并且执行结果受新闻语料被处理顺序的影响较小。本文对有效密度半径和特征空间维数的选择问题进行了讨论,并比较了该方法和Single—pass法及传统的K均值法的性能差异。实验结果表明本文所提出的方法是有效的。
其他文献
随着电动汽车应用范围的不断扩大,人们越来越重视电池组的性能及对电池的管理。有效的热管理能极大提升电池的性能。在低温环境下,使用不加热的电池严重破坏了电池的性能和预
诺基亚9500通讯器兼容现有IT基础设备,可通过无线功能,用于设备管理的个人电脑工具和定制能力进行远程管理。该机基于Symbian 7.0操作系统和Series 80平台,支持Java MIDP 2.0 和
智能手机经历了去年一年的发展,今年也逐渐走入了成熟阶段,而几大智能手机阵营也纷纷拿出了自己新的武器。多普达在春节前发布的696,打响了Pocket PC Phone操作系统的第一炮,而紧
提高知识工作者生产率将成为21世纪管理的最重要的问题,发现新的知识创造与挖掘模型将成为情报科学的研究热点。融合是中国哲学的一个特点,在中国文化知识发展过程中起到过重要
TH55的外形超美。其设计理念就像CLIE产品线负责人所说的,“TH55是一款秉承让现代人用上未来产品理念而设计的产品”。而且从TH55开始,以后的CLIE在外形上都会采用科技美学化的
随着汽车工业的发展人们对车辆的性能要求越来越高,不仅要求车辆有良好的操控性、安全性和通过性,而且还要求车辆具有很好的舒适性能,车辆的舒适性能主要体现在车辆噪声方面,
目的探讨MRI对膝关节骨挫伤的诊断价值。方法对我院56例膝关节骨挫伤的MRI检查的影像学及临床表现进行分析。结果所有患者行MRI扫描均发现所属骨端不同程度的骨挫伤表现,56例
文本分类作为处理和组织大量文本数据的关键技术,在信息过滤、信息检索、搜索引擎、数字图书馆等领域有着广泛的应用前景。基于文献计量法对1999~2008年间文本分类相关研究论
近年来,随着我国城市化进程的快速推进,无数高层和超高层建筑拔地而起,高空抛物、坠物事件时有发生。2019年12月,深圳市发生一起因业主擅自拆改承重墙体产生房屋结构安全隐患
网络技术及其所产生的海量数据的迅速发展,网络信息已经成为社会不可忽视的重要信息资源,其中不仅蕴含着大量与技术相关的信息,而且潜移默化的引导和影响技术的发展。根据此