图像型垃圾邮件过滤技术研究进展

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户：tonybenben

【摘要】

：

【作者】

：

李鹏崔刚

【出处】

：

智能计算机与应用

【发表日期】

：

2013年3期

【关键词】

：

图像型垃圾邮件垃圾邮件图像特征抽取邮件过滤近似复制检测 Image Spam Spam Image Feature Extraction Spam Fi

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：近年来，图像型垃圾邮件数量的迅速增长使得传统垃圾邮件过滤系统面临重大挑战，并逐渐成为信息安全领域的研究热点。为了能够快速、有效地滤除图像型垃圾邮件，学者们提出了大量的过滤检测方法。首先简要介绍了图像型垃圾邮件给我国带来的影响；然后结合垃圾邮件图像的特征，对图像型垃圾邮件过滤的主要技术：基于近似特征的过滤、基于图像文本特征的过滤、基于图像浅层特征的过滤等进行了分析；接下来对图像型垃圾邮件数据获取方法进行了介绍；最后对过滤技术的研究方向以及面临的挑战进行了讨论和展望。全文查看链接　　图1为利用反垃圾邮件综合处理平台捕获的部分垃圾邮件图像样本。具体来说，图1为受不同类型噪声干扰的图像样本，在这些垃圾邮件图像中使用了波动干扰、旋转干扰、背景图像干扰等多种干扰手段，给现有过滤系统制造了一定的困扰和防范阻碍。全文查看链接　　为了应对文本过滤器，垃圾邮件制造者还常采用错拼、误拼等方法混淆一些关键字，如：mortgage拼写为“mort gage”， “mo>rtglage”等。同时，对于添加噪声干扰的图像， OCR提取的文本信息还可能存在大量的错拼、误拼等现象。另外，OCR通常很难辨别‘u’和‘v’， ‘i’和‘I’， ‘l（el）’和‘1（one）’等字符。因此，为了进一步提高OCR应用的准确性，一些学者提出了改进方法。澳大利亚堪培拉大学的Ma等[19]提出为样本库中的每个关键字建立马尔科夫模型，由此对于OCR提取的未知字符序列，就可借助假设检验阈值依次判断该字符序列是否为某关键字的误拼。美国斯坦福大学的Lee等[20]利用字典树隐马尔科夫模型（LT-HMM）对邮件文本内容中的误拼、错拼等情况进行了详细分析，利用英文字典中常用的45 475个单词，以及ASCII码表中除控制符外的字符构建了一个更加鲁棒的隐马尔科夫模型，并通过统计常用的单词字符组合以及误拼、错拼情况构建了隐状态转换表和发射状态转换表。该方法可以对误拼、错拼、字符片段进行良好勘误，且具有较高的鲁棒性。但是LT-HMM具有大量的状态，内存开销较大。针对该问题，韩国浦项工科大学的Lee等[21]通过将具有相同发射概率的状态组合为超级状态，提出了一种利用动态加权隐马尔科夫模型降低HMM复杂度的方法，该方法则有效降低了HMM的状态数。上述这些手段均有利于提高利用图像文本内容实行过滤的各类方法的准确性。全文查看链接　　2 图像型垃圾邮件过滤相关产品及开源工具全文查看链接　　参考文献：全文查看链接　　[17]YOUN S， MCLEOD D. Improved spam filtering by extraction of information from text embedded image E-mail[C]//Proceedings of the ACM Symposium on Applied Computing， 2009：1754-1755. 全文查看链接

其他文献

社交媒体语境下汽车品牌危机传播与应对研究

品牌危机是品牌管理研究的重要领域。当企业发生品牌危机时,企业管理者对待危机事件的态度以及应对策略往往决定了企业能否将危机事件对品牌的伤害降到最低。在社交媒体时代,企业面对的舆论环境相比传统媒体时代更加复杂,产生危机的不确定因素更多,危机的传播持续时间更长、范围更广、伤害更大。本文以汽车品牌危机事件为研究案例,以社交媒体为研究平台,研究的问题主要有:(1)危机的类型是否会对消费者情感态度产生影响;(

学位

社交媒体汽车品牌危机危机传播危机应对

末梢微量血清游离氟测定

<正> 血氟的测定,长期以来方法众多。应用血清、全血测定血中氟含量均有报道。而笔者认为应用血清测定血氟优于全血,正常人血液中大约总氟的3/4在血浆中,当血浆氟化物含量保

期刊

氟血液测定

家庭田园教育对幼儿教育的影响

摘要：随着我国教育体制改革的不断深入，社会对幼儿的教育也提出了更高的要求，人们一直在寻求一种好的幼儿教育模式。家庭田园教育是一种教育新模式，它不仅能帮助孩子养成好的行为习惯，还能让孩子亲近大自然，享受大自然带来的快乐。　　关键词：家庭；田园教育；幼儿教育；影响　　一、引言　　随着我国教育体制的不断改革，社会对幼儿的教育越来越重视。伴随着教育体制改革，在我国的教育界出现了许多的幼儿教育机构，但是这

期刊

家庭田园教育幼儿教育影响

培养猜想与假设能力提高学生科学综合素养

随着新课程教育改革的不断深化,教师对培养学生的猜想与假设能力越来越重视。尤其在小学科学教学中,猜想与假设能力作为科学探究过程中的重要组成要素,更是贯穿于整个科学活

期刊

猜想与假设小学科学教学引导学生综合素养

细胞周期调控因子与心血管疾病

细胞周期也称细胞增殖周期，是指正常连续分裂的细胞从前一次有丝分裂结束到下一次分裂完成所经历的动态连续过程。根据细胞周期的原理，已研究出了许多抗肿瘤药物，并取得了很好的

期刊

细胞周期调控因子心血管疾病细胞增殖周期有丝分裂抗肿瘤药物临床效果冠心病高血压

小学数学教学与小学科学教学之间的联系

<正>近年来,随着时代的不断变革,学校的教育观念与家长的教育认知都有了巨大的转变。在以往的学校教学目标的设定上,更多的是注重每一个学科的教学效果,家长更加关注的是孩子

期刊

小学科学教学小学数学教学数学学科

企业文化进班级的探索与思考

企业文化是企业员工在经济活动中共同具有的理想信念、价值观念和行为准则，它是外显于企业风貌，内显于员工心灵的以价值观为核心的一种意识形态，是企业个性化的根本体现，是企业生

期刊

企业文化班级企业员工价值观念企业个性化理想信念经济活动行为准则

以学生成才为本的初中化学教学策略研究

摘要：在实际的教学中，教师通过采用有效的教学策略，能够不断地提高学生的学习能力和学习效率。因此，教师要针对以学生成才为本的初中化学教学策略进行具体的分析和研究，通过探讨为相关方面的研究提供理论性参考。　　关键词：以学生为本；初中化学；教学策略；成才　　在初中化学教学中，教师需要将学生作为课堂教学的主体，一切以学生成才为中心，通过采用一系列的教学策略，提高课堂教学的效率和学生的学习效率，促进学生的

期刊

以学生为本初中化学教学策略成才

斯奇康联合左西替利嗪治疗变应性鼻炎的疗效观察

目的观察斯奇康注射液联合左西替利嗪对变应性鼻炎的临床疗效。方法 60例变应性鼻炎患者随机分为治疗组和对照组各30例,治疗组用斯奇康注射液1mg(2mL)肌肉注射,隔日1次,联合

期刊

变应性鼻炎斯奇康注射液左西替利嗪

沥青混凝土的压实质量控制技术

沥青混凝土压实质量的好坏，将直接影响沥青路面的平整度和密实度。如何在配置较少压路机的情况下，较经济和高质量地保证路面压实质量？结合某一路段的施工实践，重点阐述了施工中控

期刊

沥青混凝土路面压实质量控制技术

图像型垃圾邮件过滤技术研究进展

与本文相关的学术论文