基于本体的垃圾邮件过滤技术研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:qwer32173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,电子邮件已经成为人们日常生活必不可少的重要组成部分,它在各个方面都展现了极大的优势,受到人们普遍的欢迎。但同时每个邮件用户每天收到的各类垃圾邮件也越来越多,这不仅影响个人生活还对整个网络造成负担,危害极大,所以垃圾邮件的识别及过滤技术日益受到重视。   目前,基于邮件内容的垃圾邮件过滤技术是解决垃圾邮件的主流技术,采用的方法主要为基于规则的方法和基于概率统计的方法。以上方法都来自于普通文本分类技术,并应用于垃圾邮件过滤。但是,垃圾邮件过滤相对于文本分类仍存在差异,主要表现为:在数据内容上,邮件具有多语言、格式多样化、多编码的特点;在垃圾邮件判断标准上,每一具体用户对垃圾邮件的定义各不相同,因此需要动态满足用户个性化需求。   本文对当前的垃圾邮件过滤技术涉及算法进行研究和分析,主要存在计算复杂、缺乏个性化定制等问题。对于重视用户体验的电子邮件过滤服务来讲,好的性能与充分满足用户需求是关键。本文通过构建垃圾邮件全局本体和从未知邮件中抽取特征概念词生成局部本体,识别并过滤垃圾有害邮件,根据用户需求构建用户个性化本体,在过滤环节更能体现用户个性,让用户有更好的使用体验。具体来说,本文的主要工作包括以下内容:   (1)介绍垃圾邮件过滤的现状。包含垃圾邮件的定义、危害以及常用的过滤技术;   (2)概述电子邮件的传输机制、主要的电子邮件相关协议、电子邮件内容格式等电子邮件相关知识;   (3)参照Wordnet词典结构,构建了电子邮件领域内的垃圾邮件语义词典,应用于做特征概念相似度计算;   (4)基于垃圾邮件自身特点,设计并构建了垃圾邮件全局本体以及用户个性化本体库,提出了面向未知邮件的权值计算算法;   (5)设计了基于本体的垃圾邮件过滤的基本框架。  
其他文献
在当今经济全球化的背景下,经济开放对地区工资差距的影响被越来越多的学者重视。无论是传统的贸易理论还是现代的中间品贸易理论,关于经济开放对工资差距的影响都不是直接得
【摘要】随着高职教育的蓬勃发展,提升人才培养质量也成为各个高职学院积极思考和课改的目标,基于行动导向的项目化课程设计无疑是提升课堂教学质量的有效途径,但是如何进行项目化课程的设计才能有别于传统课堂,真正培养学生的能力,本文从分析项目化课程设计的难点入手,以《基础会计》项目化课程设计为例提出了自己的观点。  【关键词】项目化 高职 会计  【中图分类号】F23【文献标识码】A 【文章编号】2095-
随着国际金融危机深层次影响的不断显现,我国政府顺应经济全球化、世界多极化的历史潮流,适时提出了建设“丝绸之路经济带”的倡议。该战略旨在促进沿线国家在互联互通的基础上
考虑以下非线性模型   yi=f(xi,θ)+ei,i=1,2,…,n其中θ为—P维未知参数,xi为q维已知向量,f为已知函数,ei为不可观测的随机误差,yi为观察值.设Θ为参数空间,Θ?RP,xi∈,x,i=1,2
近些年来,随着我国经济的快速发展,房产市场也逐步进入公众的视线。特别是金融危机以后,由于国内宏观环境相对稳定,外来短期资本出于避险和投资等动机,纷纷进入到我国的房产市场,尽
在阅读过程中,我们常常会遇到含有“to one’s+情感名词”这一结构的句子,如:To my relief,my son’s life was not in danger.(令我感到宽慰的是,我儿子的生命没有危险。)此结构表示由于某事的发生而刺激了内心世界,因此而唤起种种情感。汉语意思为“令某人(喜、怒、哀、乐……)的是……”或“使某人感到(喜、怒、哀、乐……)的是……”。此结构在使用中有以下特点