论文部分内容阅读
本文通过分析研究现有的反垃圾邮件过滤技术,结合垃圾邮件自身的特点,从电子邮件的文本内容出发,将Winnow算法应用于垃圾邮件过滤,试图构造一种速度快、计算简便、性能好、反馈学习方便的垃圾邮件过滤系统。
针对中文垃圾邮件,把过滤单元划分成训练、分类和反馈三个主要过程,分别对应样本邮件的训练即分类器的构造,新邮件的分类以及分类结果的反馈;并给出了部分重要模块的实现。
为了提高系统性能,着重改进了邮件解码模块,构造了最基本的Winnow分类器,采用了增量式反馈学习方法。