基于增量学习和主动学习的垃圾邮件识别新方法

来源 :第五届全国计算机取证技术研讨会 | 被引量 : 0次 | 上传用户:mhpymhpy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾邮件识别是计算机取证领域的重要研究内容.多数垃圾邮件识别方法未能有效地考虑用户兴趣邮件识别结果的影响.提出了一种基于增量学习和主动学习的垃圾邮件识别新方法.为获得最有效特征,在特征选择阶段综合考虑了单词信息和非单词信息;接着,为减少待标注样本选择时间,提出了一种基于投影的不确定样本选择方法;最后,在样本标注过程中,提出了自动推荐样本类别及用户兴趣度的样本标注新方法.多种对比实验表明,算法针对垃圾邮件识别精度高,待标注样本选择速度较快,用户标注负担较小,具有较高的应用价值.
其他文献
过渡是自然界和日常生活中普遍存在的现象,它是科学研究、工程技术和社会管理中必须面对的问题.介绍了过渡现象研究的历史及现状,并分别采用传递性、区间和逻辑方法描述了过
尽管我国内部控制研究日渐丰富,但是研究重心还是以医院等事业单位为主,对中小学校的内部控制研究相对较少。2012年《行政事业单位内部控制规范》(试行)实施以来,中小学校的
分析了少数民族语言文字网站的特殊性,综合采用基于特殊字符、网页标签属性和N-gram的方法对传统蒙古文、藏文、阿拉伯字母体系的维吾尔文、哈萨克文和柯尔克孜文以及彝文、新傣文、朝鲜文、俄文和壮文等10种少数民族语言文字网站进行了自动识别研究。所提方法对10种少数民族语言文字网站的平均正确识别率达到95%以上,效果令人满意。
构建了CH_(4)-O_(2)-N_(2)-H_(2)O反应体系,对介质阻挡放电条件下甲烷水蒸气重整和部分氧化制氢反应过程进行了研究,考察了H_(2)O/CH_(4)物质的量比、O_(2)/N_(2)物质的量比
《国务院关于加快发展现代职业教育的决定》犹如一股春风,吹醒了人民对职业教育的模糊认识,也为中国职业教育的内涵发展和体系建设指明了方向。近日,笔者就相关话题专访了全国职业教育“黄炎培”杰出校长、世界美发组织“国际个人成就奖”获得者、南京金陵中等专业学校姜峻校长。笔者:发展职业教育成为国家战略,“劳动光荣、技能宝贵、创造伟大”已经成为时代风尚。请问学校如何把握机遇推进发展?姜峻校长:国务院出台《国务院
为独立方法定义严谨的规格可以保证程序的正确性。但是在面向对象的程序中,方法之间因为共享属性而相互影响,这就需要能够反映方法间影响的规格化方法。研究者们使用抽象变量、状态抽象、堆、查询等多种方法进行了尝试。文中给出一种基于抽象状态的类的行为规格方法,该方法基于抽象状态解决了类方法间的共享依赖和相互影响,同时实现了规格与实现的独立描述与运行时自动化验证。
为了提高加权质心定位算法在室内环境中的定位精度,提出使用实际环境中的RSS数据通过蝙蝠算法拟合输入隶属度函数,通过Mamdani型模糊推理获得节点间精确的权值,以提高加权质
政府与企事业单位的人事部门通常面临着如何从大量简历中筛选出合适人选的问题。一些业务部门对人才的需求通常只能表达为标签,比如"具有丰富搜索引擎开发经验"、"985高校毕业"等
摘要:高等职业教育发展与区域产业结构存在共生、互利、互为因果的关系。中国(广西)自由贸易试验区是新时代推进广西改革发展的战略举措,综合分析自贸试验区发展产业结构特征,研究当前广西高等职业教育专业与产业发展的适应性,提出广西区域高等职业院校扩大专业布点规模、发展面向东盟特色新专业、发展部分紧缺专业、稳定发展优势专业、升级改造部分专业等专业调整建议。  关键词:高职教育;专业调整;产业结构  中图分类
最近几年可穿戴设备发展迅速,各种样式和用途的可穿戴设备大量出现。然而这些可穿戴设备大多都是独立工作的,设备与设备之间鲜有联系。为此提出了一个以智能手机为中心的、支