多特征结合的中文垃圾邮件过滤特征选择方法研究

来源 :内蒙古工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:wulaixiaosheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文垃圾邮件过滤系统中,基于内容过滤的Na?ve Bayes算法得到了广泛应用。本文将多种特征结合构建邮件文本向量,应用八种文本分类特征选择方法在Na?ve Bayes算法上进行实验验证,通过准确率和召回率结合的综合性能指标F1值进行性能评价,结果表明,采用类别区分词、优势率、信息增益、期望交叉熵、CHI统计和文本证据权等六种特征选择方法应用于多特征结合邮件文本向量的过滤取得了较好的垃圾邮件过滤性能,反垃圾邮件效果较好。
其他文献
美国之所以成为世界第一工业强国和科学技术中心,主要受益于美国政府一贯重视人才资源的管理和开发。美国政府对人才资源管理和开发的做法是:重视教育的发展,积极开发本国人才资
教师是承担教书育人责任的重要主体,教师的教学积极性既直接影响着教学质量和育人水平,同时也是学校推动教学方式改革的主要实践者。因此,要在教育信息化时代下推动微课教学工作
摘 要:研究现代机械行业中普遍应用的锥齿轮零件数控多轴加工工艺方法,探讨在教育教学中如何培养大学生的创新设计和创新制造能力,阐述了大学生创新能力训练在课程教学改革中的具体措施。实践证明,新技术、新工艺方法在智能制造中的创新运用是培养学生综合职业能力和创新能力的关键。  关键词:创新设计 创新制造 能力培养  中图分类号:G64 文献标识码:A 文章编号:1672-3791(2018)09(c)-0
用CeSAPO-5分子筛催化乙酸和正丁醇合成乙酸正丁酯,得出适宜的酯化条件:酸醇比1:1,催化剂用量0.2g,带水剂用量5mL,反应时间7h,反应温度95℃,乙酸的转化率可达57.01%。