【摘 要】
:
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相
【机 构】
:
广东外语外贸大学信息学院,广州,510006
论文部分内容阅读
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度.
其他文献
新时期政府提出了“营改增”的税收政策,是为了减小征税基数,降低征税额度,减轻企业负担,有利于企业快速发展;有利于促进企业内部体制改革,通过这一政策的推行,避免了重复征
4月,最牵动人心的莫过于H7N9这个名词了.受此影响,我国禽肉类市场交易陷入低谷.不过此前普遍低迷的水产品价格却因此有了一些起色.很难说这消息是好是坏.对于水产业者来说,水
1.等级保护技术需求要点分析rn自2008年度开始,等级保护将逐步进入规划设计和安全实施阶段.在规划设计阶段,如何从组织整体出发,从大处着眼统筹考虑系统面临的安全性问题,对
随着我国经济建设的快速发展,极大的促进了我国市政基础设施项目的建设与发展.然而随着市场机制的不断改革和完善,市政施工企业所面临的市场竞争越来越大.在这样的背景下,在
近些年来,我国的科技水平不断提高,在这一背景下建筑行业也实现了一定的发展.在建筑工程逐渐崛起的过程里,相关工作人员逐渐加大了对建筑工程造价的重视力度,近些年来加大了
PXI 8170 /85 0RT控制器基于PXI/CompactPCItNT公司的LabVIEW实时技术。这种具有以太网功能的控制器使用PentiumIII 85 0MHz的处理器来加强实时操作系统的确实性和可靠性。PXI 8170 /85 0RT具有比PXI 815 6B/333RT控制器
The PXI